Python 2和3的通用编码检测器
项目描述
Charade:通用字符编码检测器
- 检测
ASCII, UTF-8, UTF-16(2种变体),UTF-32(4种变体)
Big5, GB2312, EUC-TW, HZ-GB-2312, ISO-2022-CN(繁体和简体中文)
EUC-JP, SHIFT_JIS, ISO-2022-JP(日语)
EUC-KR, ISO-2022-KR(韩语)
KOI8-R, MacCyrillic, IBM855, IBM866, ISO-8859-5, windows-1251(西里尔文)
ISO-8859-2, windows-1250(匈牙利语)
ISO-8859-5, windows-1251(保加利亚语)
windows-1252(英语)
ISO-8859-7, windows-1253(希腊语)
ISO-8859-8, windows-1255(视觉和逻辑希伯来语)
TIS-620(泰语)
需要Python 2.6或更高版本
命令行工具
chardet附带一个命令行脚本,该脚本报告一个或多个文件的编码
% charade somefile someotherfile somefile: windows-1252 with confidence 0.5 someotherfile: ascii with confidence 1.0
关于
这是Mark Pilgrim的出色chardet的移植。前两个版本需要维护:一个支持python 2.x,另一个支持python 3.x。在这个端口上投入了少量工作后,charade现在在单个代码库中支持两者。
这项工作的基础是马克拥有的python 3000版本的chardet源代码的最新副本。
原因
每件事都必须有原因吗?不,但在这个案例中,原因是为了帮助requests以及任何急需这个功能的任何人。
关于x、y或z怎么办?
如果确实存在x、y或z(这是一个对可能执行相同功能的其他项目的口语化表达),那么我对它们没有更好地宣传自己感到失望。这会节省我很多时间。
- 维护者:
伊恩·科多斯科
1.0.3 – 2012-01-17
将chardet.py脚本重命名为charade
项目详情
关闭
charade-1.0.3.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a607146d151005904f3fd8335e3dc89af214453f0d3a29580e1eb0e67e6c3d7f |
|
MD5 | 79ac701a147705c09bdce31b79dfa12e |
|
BLAKE2b-256 | 7426565610c87e951b8a3182df890589c280a16c5897cfbca97eebd73705e0c6 |