跳转到主要内容

Python 3文本挖掘工具

项目描述

textmining3

https://img.shields.io/pypi/v/textmining.svg https://img.shields.io/travis/djcomlab/textmining3.svg Documentation Status

Python 3文本挖掘工具

功能

此软件包包含Python 3文本挖掘的多种有用功能。

它专注于统计文本挖掘(即词袋模型),并使从文档集合创建词-文档矩阵变得非常容易。然后可以从统计软件包(R、MATLAB等)读取此矩阵以进行进一步分析。该软件包还提供了一些有用的工具,用于查找搭配(即显著的双词短语)、计算单词之间的编辑距离以及将长文档分成较小的部分。

该软件包包含大量精选数据(停用词、常见名字、包含词性和词频的英语词典),使用户能够从文档中提取相当复杂的功能。

此软件包 没有 任何自然语言处理功能,如词性标注。有关此类功能,请参阅Python NLTK(以及更多内容)。

原始代码和文档可在PyPI上以包名textmining找到。此包是Python 3的移植版本,并在PyPI上以包名textmining3发布,基于原始版本。

致谢

原始的textmining 1.0包代码由Christian Peccei 编写 <cpeccei@hotmail.com>

此包使用Cookiecutteraudreyr/cookiecutter-pypackage项目模板创建。

历史

1.1.0 (2018-13-19)

  • 添加新功能,导出DTM到pandas.DataFrame

1.0.2 (2018-12-19)

  • textmining首次移植到Python 3

1.0.0 (2010-01-11)

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

textmining3-1.1.0.tar.gz (23.9 kB 查看哈希值)

上传时间 源代码

构建分发

textmining3-1.1.0-py2.py3-none-any.whl (1.9 MB 查看哈希值)

上传时间 Python 2 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面