跳转到主要内容

将URL标准化为标准unicode编码

项目描述

urlnorm.py

将URL标准化为标准unicode表示

urlnorm通过以下方式标准化URL:

  • 将方案和主机名转换为小写

  • 将主机名转换为IDN格式

  • 如果有默认端口,则移除(例如,http://www.foo.com:80/

  • 合并路径(./, ../, 等)

  • 如果主机名以'.'结尾,则移除最后一个字符

  • 取消任何可能的%转义的字符(如果可能的话)

安装

pip install urlnorm

示例

>>> import urlnorm
>>> urlnorm.norm("http://xn--q-bga.com./u/u/../%72/l/")
u'http://q\xe9.com/u/r/l/'

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分布

urlnorm-1.1.4.tar.gz (4.3 kB 查看哈希值)

上传时间:

由以下组织支持