跳转到主要内容

统计文本文件中的字母、字母对和单词的数量。还涵盖了梵文和孟加拉文连字符

项目描述

=====
文本频率
=====

描述
-----
一个用于统计以下文本频率的脚本
•单词
•字母
•字母对
•梵文连字符
•孟加拉文连字符

能很好地处理非ASCII文件。1gb的数据大约需要5-7分钟。

安装
-----
- pip或easy_install 'textfreq'

用法
-----
在Shell/命令提示符中:``textfreq <INPUT.txt> <OUTPUT.txt> <命令:-w(单词),-p(对),-l(字母),-dc(梵文连字符),-bc(孟加拉文连字符)>``

版本历史
-----
***V0.100***
- 显著提高速度
- 添加梵文和孟加拉文连字符查找器

***V0.001***
- 添加单词、对和字母计数

项目详情


下载文件

下载适合您平台的应用程序。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分发

textfreq-0.100.tar.gz (3.3 kB 查看哈希值)

上传时间: 源码

由以下支持