跳转到主要内容

多语言自然语言工具,包装NLTK和其他系统。

项目描述

此软件包提供NLTK和其他系统的包装,以提供方便的自然语言工具,例如

  • 标记化器

  • 停用词去除器

  • 单词频率查找

  • 词形还原器(将单词还原为其基本形式,可能考虑词性标记)

  • 东亚语言分析器(例如,我们目前使用MeCab过程来查找日语的单词分隔)

对于某些语言的单词频率,metanl使用利兹大学翻译研究中心的语料库(http://corpus.leeds.ac.uk/list.html),其数据在Creative Commons Attribution许可下发布。

作者:Rob Speer

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

metanl-0.5.6.tar.gz (23.0 MB 查看哈希值)

上传时间 源代码

由以下支持

AWSAWS 云计算和安全赞助商 DatadogDatadog 监控 FastlyFastly CDN GoogleGoogle 下载分析 MicrosoftMicrosoft PSF赞助商 PingdomPingdom 监控 SentrySentry 错误日志 StatusPageStatusPage 状态页面