跳转到主要内容

未提供项目描述

项目描述

Pypi Installs Latest Version Supported Python Versions

Mathics3自然语言工具包模块。

示例会话

$ mathicsscript
In[1]:= LoadModule["pymathics.natlang"]
Out[1]= pymathics.natlang
In[2]= Pluralize["try"]
Out[2]= tries
In[3]= WordFrequency["Apple Tree and apple", "apple", IgnoreCase -> True]
Out[3]= 0.5
In[4] = TextCases["I was in London last year.", "Pronoun"]
Out[4]= {I}

更多示例可以在测试文件中找到。

安装和运行

要使用构建模块,您需要安装Python模块nltkspacy,然后安装一些语言特定的单词数据

$ make develop  # or make install

上述make命令使用默认语言为英语。如果您想安装其他语言,请设置变量LANG。例如

$ make develop LANG=fr

为了使用NLTK和扩展的开放式多语言Wordnet以及使用更多语言,您需要手动安装它们。访问http://compling.hss.ntu.edu.sg/omw/summx.html,下载数据,然后在$HOME/nltk_data/corpora/omw/your_language下创建一个新文件夹,将wiki/wn-wikt-your_language.tab文件放入该文件夹,并将其重命名为wn-data-your_language.tab。

如果您收到消息

OSError: [E050] Can't find model 'en'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory.

Python中高级自然语言处理库spacy存在问题。

您可能可以通过运行以下操作来解决此问题

python -m spacy download en

根据需要调整上面的“python”和“en”(您想使用的语言)。

用户自定义

为了使用扩展的开放多语言Wordnet (OMW) 与 ‘NLTK’ 并使用更多语言,您需要手动安装它们。

访问 http://compling.hss.ntu.edu.sg/omw/summx.html,下载数据,然后在 $HOME/nltk_data/corpora/omw/your_language 下创建一个新文件夹,将 wiki/wn-wikt-your_language.tab 文件放入该文件夹,并将其重命名为 wn-data-your_language.tab。

添加更多语言到开放多语言Wordnet

为了使用扩展的开放多语言Wordnet 与 NLTK 并使用更多语言,您需要手动安装它们。访问 http://compling.hss.ntu.edu.sg/omw/summx.html,下载数据,然后在 $HOME/nltk_data/corpora/omw/your_language 下创建一个新文件夹,将 wiki/wn-wikt-your_language.tab 文件放入该文件夹,并将其重命名为 wn-data-your_language.tab。

下载文件

下载适合您平台文件的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

pymathics-natlang-7.0.0.tar.gz (32.2 kB 查看哈希值)

上传时间 源代码

构建分发

pymathics_natlang-7.0.0-py3-none-any.whl (33.6 kB 查看哈希值)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面