Python 3文本挖掘工具
项目描述
textmining3
Python 3文本挖掘工具
自由软件:GNU通用公共许可证v3
需要Python >= 3.6
功能
此软件包包含Python 3文本挖掘的多种有用功能。
它专注于统计文本挖掘(即词袋模型),并使从文档集合创建词-文档矩阵变得非常容易。然后可以从统计软件包(R、MATLAB等)读取此矩阵以进行进一步分析。该软件包还提供了一些有用的工具,用于查找搭配(即显著的双词短语)、计算单词之间的编辑距离以及将长文档分成较小的部分。
该软件包包含大量精选数据(停用词、常见名字、包含词性和词频的英语词典),使用户能够从文档中提取相当复杂的功能。
此软件包 没有 任何自然语言处理功能,如词性标注。有关此类功能,请参阅Python NLTK(以及更多内容)。
原始代码和文档可在PyPI上以包名textmining找到。此包是Python 3的移植版本,并在PyPI上以包名textmining3发布,基于原始版本。
致谢
原始的textmining 1.0包代码由Christian Peccei 编写 <cpeccei@hotmail.com>
此包使用Cookiecutter和audreyr/cookiecutter-pypackage项目模板创建。
历史
1.1.0 (2018-13-19)
添加新功能,导出DTM到pandas.DataFrame
1.0.2 (2018-12-19)
textmining首次移植到Python 3
1.0.0 (2010-01-11)
textmining在PyPI上的原始发布(见https://pypi.ac.cn/project/textmining/1.0/)
项目详情
关闭
textmining3-1.1.0.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 22cf971937a76f00722eadd0249b85bed9888cfaf57eaca238c8e55220c7bdb8 |
|
MD5 | 9a77cc5bc65751008772001e04c07517 |
|
BLAKE2b-256 | d37e78a5b991108302eb44b0a5347d274f9be6607fb41dd45c53e28244cce76f |
关闭
textmining3-1.1.0-py2.py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | e7a3c8ffc670caede8a6c1013c82082f3487e29fc3b652bdb9f56e1c66252f75 |
|
MD5 | 6eb6baf13e461a53b114ca27c7c34f27 |
|
BLAKE2b-256 | 14334d75039a7a9cd6bf07551cb2be035d43e6edacac5e2b5f3662d5f2343236 |