未提供项目描述
项目描述
CL ToolKit
一个用于处理跨语言数据的Python库。
由Johann-Mattis List和Robert Forkel创建。
概述
虽然pycldf提供了一个基本的Python API来访问编码在CLDF数据集中的跨语言数据,但cltoolkit
更进一步,将数据转换为完整的Python对象,而不是CSV文件行中的浅代理。当然,与pycldf
的ORM包一样,这里涉及权衡,以便利的访问和更Pythonic的API为代价,牺牲性能(特别是内存占用但也是数据加载时间)和写访问。但大多数今天的CLDF数据集(或这些数据的聚合)将在合理的硬件上用cltoolkit
在几分钟内即可处理——而不是几个小时。
cltoolkit
背后的主要思想是使(聚合的)CLDF数据易于进行计算,以一般意义上的语言特征(例如,类型学特征等)。这是通过
- 为处理代码提供数据 作为Python对象,
- 提供一个 框架,该框架使得特征计算与编写一个作用于
cltoolkit.models.Language
对象的Python函数一样简单。
总的来说,聚合的CLDF词表在数据集之间(例如,可以比较每个数据集中每种语言的单词数量)提供了有限的(自动化的)可比性。当数据集使用CLDF参考属性链接到参考目录时,可以做更多的事情,即
cltoolkit
对象通过区分“词义”和“概念”、“图形符号”和“声音”,并方便地访问聚合中对象的可比子集来利用这种扩展的可比性(见models.py)。
有关使用cltoolkit
的典型工作流程的说明,请参阅example.md。
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源代码分发
cltoolkit-0.1.1.tar.gz (24.5 kB 查看哈希值)
构建分发
cltoolkit-0.1.1-py2.py3-none-any.whl (25.8 kB 查看哈希值)
关闭
cltoolkit-0.1.1.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b68d48706ac740a308011071c4e795ecde3c280205e65e0a69671933e3c9981d |
|
MD5 | b5dbb7f91457e7f9a0d5bc8dc810ff20 |
|
BLAKE2b-256 | cf0f4b6eaa64c2296d8f545099a654109d139b0fbd8380314107eb9e06074fb3 |
关闭
cltoolkit-0.1.1-py2.py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 97642c66d03ce585dda2470b3cdd28e396a8cf7786b3575237f7e5e95fdd53b0 |
|
MD5 | b563af8d0b1ae2d9e140b12f5b64054b |
|
BLAKE2b-256 | 5bc6f618c5fe4fda44210ebaf023060d22341fe5eba69649c0aba3de8ca739c9 |