统计文本文件中的字母、字母对和单词的数量。还涵盖了梵文和孟加拉文连字符
项目描述
=====
文本频率
=====
描述
-----
一个用于统计以下文本频率的脚本
•单词
•字母
•字母对
•梵文连字符
•孟加拉文连字符
能很好地处理非ASCII文件。1gb的数据大约需要5-7分钟。
安装
-----
- pip或easy_install 'textfreq'
用法
-----
在Shell/命令提示符中:``textfreq <INPUT.txt> <OUTPUT.txt> <命令:-w(单词),-p(对),-l(字母),-dc(梵文连字符),-bc(孟加拉文连字符)>``
版本历史
-----
***V0.100***
- 显著提高速度
- 添加梵文和孟加拉文连字符查找器
***V0.001***
- 添加单词、对和字母计数
文本频率
=====
描述
-----
一个用于统计以下文本频率的脚本
•单词
•字母
•字母对
•梵文连字符
•孟加拉文连字符
能很好地处理非ASCII文件。1gb的数据大约需要5-7分钟。
安装
-----
- pip或easy_install 'textfreq'
用法
-----
在Shell/命令提示符中:``textfreq <INPUT.txt> <OUTPUT.txt> <命令:-w(单词),-p(对),-l(字母),-dc(梵文连字符),-bc(孟加拉文连字符)>``
版本历史
-----
***V0.100***
- 显著提高速度
- 添加梵文和孟加拉文连字符查找器
***V0.001***
- 添加单词、对和字母计数
项目详情
关闭
textfreq-0.100.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | af6acf5403c7358c76e81c22f6b3e071571d7633d90f18a0603a66b76625d832 |
|
MD5 | b7aab1051bed5bdf977d84596107caff |
|
BLAKE2b-256 | 2757d0530f43b76af92b3d6a574efe6dd03db573f4ab9b3162004d4dab7cc63d |