跳转到主要内容

基于Web的计算机辅助语言比较工具

项目描述

LingRex: 使用LingPy进行语言学重建

Build Status DOI PyPI version

LingRex提供了以下论文中描述的自动推断音对应模式的代码

List, J.-M. (2019): 多语言间音对应模式的自动推断。计算语言学 45.1. 137-161. DOI: 10.1162/coli_a_00344

要测试此工作流程,请查看 tests/workflows/list-2019 中的工作流程代码示例。

LingRex 还提供用于监督式自动单词预测或自动语音重建的基线算法所需的代码。

List, J.-M. 和 R. Forkel 及 N. W. Hill(2022):使用修剪对齐和语音对应模式快速进行自动语音重建的新框架。第3届国际计算方法处理历史语言变化研讨会(LChange 2022)论文集。爱尔兰,都柏林。https://aclanthology.org/2022.lchange-1.9

此算法还被用作 SIGTYP 工作坊在 NAACL 2022 上组织的认知词预测共享任务(https://sigtyp.github.io/st2022.html)的基线。

List, J.-M.,E. Vylomova,R. Forkel,N. Hill 和 R. Cotterell(2022):SIGTYP 共享任务中的认知词预测。见:第4届计算类型学和多语言自然语言处理研讨会论文集。计算语言学协会 52-62。 https://aclanthology.org/2022.sigtyp-1.7

部分认知词的处理方法在 Wu 和 List(2023)的研究中提出。

Wu, M.-S. 和 J.-M. List(2023):在东南亚语言的系统发育研究中标注同源词。语言动态与变化。 https://doi.org/10.1163/22105832-bja10023

语音对齐修剪方法在 Blum 和 List(2023)的研究中提出。

Blum, F. 和 J.-M. List(2023):修剪语音对齐可提高从多语言词表推断语音对应模式的能力。见:第5届计算类型学和多语言自然语言处理研讨会论文集。计算语言学协会。52-64。 https://aclanthology.org/2023.sigtyp-1.6.pdf

模糊/不确定语音重建的处理和创建方法在 List 等人(2023)的研究中提出。

List, J.-M.;Hill, N. W.;Blum, F.;和 Forkel, R.(2023):语音重建中不确定性的表示和计算新框架。第4届计算方法处理历史语言变化研讨会论文集。22-32。 https://aclanthology.org/2023.lchange-1.3

在您的研究中使用此软件包时,请确保根据您使用的算法引用相应的论文,并按照以下方式引用软件包:

List, J.-M. 和 R. Forkel(2023):LingRex:使用 LingPy 进行语言重建。[计算机软件,版本 1.4.0]。由 Frederic Blum 和 Mei-Shin Wu 贡献。莱比锡:马克斯·普朗克进化人类学研究所。https://pypi.ac.cn/project/lingrex

由于此软件包本身也使用了 LingPy 的对齐算法,因此还应引用 LingPy 软件包本身。

List, J.-M. 和 R. Forkel(2023):LingPy。历史语言学定量任务用的 Python 库。版本 2.6.10。马克斯·普朗克进化人类学研究所:莱比锡。 https://lingpy.org

安装

使用 pip 安装此软件包。

pip install lingrex

更多示例

在 LingRex 中实现的借用检测算法在以下论文中介绍

List, J.-M. 和 R. Forkel(2021):多语言词表中自动识别借用。[版本 1;同行评审:3票批准,1票有保留地批准]。Open Research Europe 1.79。1-11。 DOI: 10.12688/openreseurope.13843.1

如果您使用此算法,请引用 LingRex 和此论文。

除了首次介绍对应模式推断算法的论文外,LingRex 还提供了计算以下论文中描述的工作流的代码

吴,M.-S.,N. Schweikhard,T. Bodt,N. Hill,和J.-M. List(2020):计算机辅助语言对比。现状。开放人文数据杂志 6.2. 1-14. DOI:10.5334/johd.12

为了测试此工作流程,请查看位于tests/workflows/wu-2020中的工作流程代码示例。

如果您在自己的工作中使用此工作流程,请引用此论文。

此外,我们(与T. Bodt合作)利用音对应模式预测词汇的实验也使用了LingRex包。

Bodt, T. 和 J.-M. List(2021):反演预测。以西方科布瓦语为例。Diachronica 0.0. 1-38. DOI:10.1075/dia.20009.bod

为了测试此工作流程,请查看位于tests/workflows/bodt-2019中的工作流程代码示例。

项目详情


下载文件

下载适合您平台文件的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分发

lingrex-1.4.2.tar.gz (40.6 kB 查看哈希)

上传时间:

构建分发

lingrex-1.4.2-py2.py3-none-any.whl (38.8 kB 查看哈希)

上传时间: Python 2 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面