跳转到主要内容

未提供项目描述

项目描述

CL ToolKit

Build Status Documentation Status PyPI

一个用于处理跨语言数据的Python库。

由Johann-Mattis List和Robert Forkel创建。

概述

虽然pycldf提供了一个基本的Python API来访问编码在CLDF数据集中的跨语言数据,但cltoolkit更进一步,将数据转换为完整的Python对象,而不是CSV文件行中的浅代理。当然,与pycldf的ORM包一样,这里涉及权衡,以便利的访问和更Pythonic的API为代价,牺牲性能(特别是内存占用但也是数据加载时间)和写访问。但大多数今天的CLDF数据集(或这些数据的聚合)将在合理的硬件上用cltoolkit在几分钟内即可处理——而不是几个小时。

cltoolkit背后的主要思想是使(聚合的)CLDF数据易于进行计算,以一般意义上的语言特征(例如,类型学特征等)。这是通过

  • 为处理代码提供数据 作为Python对象
  • 提供一个 框架,该框架使得特征计算与编写一个作用于cltoolkit.models.Language对象的Python函数一样简单。

总的来说,聚合的CLDF词表在数据集之间(例如,可以比较每个数据集中每种语言的单词数量)提供了有限的(自动化的)可比性。当数据集使用CLDF参考属性链接到参考目录时,可以做更多的事情,即

cltoolkit对象通过区分“词义”和“概念”、“图形符号”和“声音”,并方便地访问聚合中对象的可比子集来利用这种扩展的可比性(见models.py)。

有关使用cltoolkit的典型工作流程的说明,请参阅example.md

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

cltoolkit-0.1.1.tar.gz (24.5 kB 查看哈希值)

上传时间 源代码

构建分发

cltoolkit-0.1.1-py2.py3-none-any.whl (25.8 kB 查看哈希值)

上传时间 Python 2 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面