跳转到主要内容

旧版网页内容的字符编码别名

项目描述

这是WHATWG编码标准的Python实现。

为了在解释类似 Content-Type: text/html; charset=latin1 的内容时与旧版网页内容兼容,工具需要使用特定的一组别名以及一些覆盖规则。例如,网页上的 US-ASCIIiso-8859-1 实际上是 windows-1252 的别名,UTF-8 或 UTF-16 BOM 优先于任何其他编码声明。编码标准定义了所有这些细节,以便实现不需要反向工程。

此模块具有编码标签和BOM检测,但编解码器的实际实现是Python的。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

webencodings-0.5.1.tar.gz (9.7 kB 查看哈希值)

上传时间

构建分布

webencodings-0.5.1-py2.py3-none-any.whl (11.8 kB 查看哈希值)

上传时间 Python 2 Python 3

支持者

AWSAWS云计算和安全赞助商DatadogDatadog监控FastlyFastlyCDNGoogleGoogle下载分析MicrosoftMicrosoftPSF赞助商PingdomPingdom监控SentrySentry错误日志StatusPageStatusPage状态页面