跳转到主要内容

Python 2和3的通用编码检测器

项目描述

Charade:通用字符编码检测器

检测
  • ASCII, UTF-8, UTF-16(2种变体),UTF-32(4种变体)

  • Big5, GB2312, EUC-TW, HZ-GB-2312, ISO-2022-CN(繁体和简体中文)

  • EUC-JP, SHIFT_JIS, ISO-2022-JP(日语)

  • EUC-KR, ISO-2022-KR(韩语)

  • KOI8-R, MacCyrillic, IBM855, IBM866, ISO-8859-5, windows-1251(西里尔文)

  • ISO-8859-2, windows-1250(匈牙利语)

  • ISO-8859-5, windows-1251(保加利亚语)

  • windows-1252(英语)

  • ISO-8859-7, windows-1253(希腊语)

  • ISO-8859-8, windows-1255(视觉和逻辑希伯来语)

  • TIS-620(泰语)

需要Python 2.6或更高版本

命令行工具

chardet附带一个命令行脚本,该脚本报告一个或多个文件的编码

% charade somefile someotherfile
somefile: windows-1252 with confidence 0.5
someotherfile: ascii with confidence 1.0

关于

这是Mark Pilgrim的出色chardet的移植。前两个版本需要维护:一个支持python 2.x,另一个支持python 3.x。在这个端口上投入了少量工作后,charade现在在单个代码库中支持两者。

这项工作的基础是马克拥有的python 3000版本的chardet源代码的最新副本。

原因

每件事都必须有原因吗?不,但在这个案例中,原因是为了帮助requests以及任何急需这个功能的任何人。

关于x、y或z怎么办?

如果确实存在x、y或z(这是一个对可能执行相同功能的其他项目的口语化表达),那么我对它们没有更好地宣传自己感到失望。这会节省我很多时间。

维护者:

伊恩·科多斯科

1.0.3 – 2012-01-17

  • chardet.py脚本重命名为charade

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分布

charade-1.0.3.tar.gz (168.5 kB 查看哈希值)

上传时间

由以下支持