未提供项目描述
项目描述
Mathics3自然语言工具包模块。
示例会话
$ mathicsscript In[1]:= LoadModule["pymathics.natlang"] Out[1]= pymathics.natlang In[2]= Pluralize["try"] Out[2]= tries In[3]= WordFrequency["Apple Tree and apple", "apple", IgnoreCase -> True] Out[3]= 0.5 In[4] = TextCases["I was in London last year.", "Pronoun"] Out[4]= {I}
更多示例可以在测试文件中找到。
安装和运行
要使用构建模块,您需要安装Python模块nltk和spacy,然后安装一些语言特定的单词数据
$ make develop # or make install
上述make命令使用默认语言为英语。如果您想安装其他语言,请设置变量LANG。例如
$ make develop LANG=fr
为了使用NLTK和扩展的开放式多语言Wordnet以及使用更多语言,您需要手动安装它们。访问http://compling.hss.ntu.edu.sg/omw/summx.html,下载数据,然后在$HOME/nltk_data/corpora/omw/your_language下创建一个新文件夹,将wiki/wn-wikt-your_language.tab文件放入该文件夹,并将其重命名为wn-data-your_language.tab。
如果您收到消息
OSError: [E050] Can't find model 'en'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory.
Python中高级自然语言处理库spacy存在问题。
您可能可以通过运行以下操作来解决此问题
python -m spacy download en
根据需要调整上面的“python”和“en”(您想使用的语言)。
用户自定义
为了使用扩展的开放多语言Wordnet (OMW) 与 ‘NLTK’ 并使用更多语言,您需要手动安装它们。
访问 http://compling.hss.ntu.edu.sg/omw/summx.html,下载数据,然后在 $HOME/nltk_data/corpora/omw/your_language 下创建一个新文件夹,将 wiki/wn-wikt-your_language.tab 文件放入该文件夹,并将其重命名为 wn-data-your_language.tab。
添加更多语言到开放多语言Wordnet
为了使用扩展的开放多语言Wordnet 与 NLTK 并使用更多语言,您需要手动安装它们。访问 http://compling.hss.ntu.edu.sg/omw/summx.html,下载数据,然后在 $HOME/nltk_data/corpora/omw/your_language 下创建一个新文件夹,将 wiki/wn-wikt-your_language.tab 文件放入该文件夹,并将其重命名为 wn-data-your_language.tab。
项目详情
下载文件
下载适合您平台文件的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。