从URL中提取域的实用函数集合。
项目描述
domain_utils
从URL中提取域的实用函数集合。
仓库: https://github.com/mozilla/domain_utils
安装
pip install domain_utils
使用
import domain_utils as du
# Return just the url `my.domain.cloudfront.net/a/path/to/a/file.html`
du.stem_url('https://my.domain.cloudfront.net/a/path/to/a/file.html?a=1')
# Return just the eTLD+1 `domain.cloudfront.net`
du.get_etld1('https://my.domain.cloudfront.net/a/path/to/a/file.html?a=1')
# Get the port `5000`
du.get_port('https://:5000/a/path/to/a/file.html?a=1')
# Get the scheme `wss`
du.get_port('wss://somedomain.example.com/a/path/to/a/ws')
此软件包最初是从 openwpm-utils 中提取出来的。
- 自由软件:Mozilla公共许可证 
社区参与指南
该项目受Mozilla的行为准则和礼仪指南管理。
如需了解更多详情,请阅读Mozilla社区参与指南。
有关如何报告违反社区参与指南的信息,请参阅我们的如何报告页面。
历史
0.7.1 (2020-04-10)
修复在readthedocs上的构建问题。
0.7.0 (2020-04-10)
感谢新贡献者@yabirgb在本版本中提交的两个PR(#20和#25)。
API变更:#26将< cite>get_stripped_url重命名为< cite>stem_url,将< cite>get_ps_plus_1重命名为< cite>get_etld1。尽管如此,旧方法名称将继续有效。#22更新了< cite>get_stripped_url的关键字参数 - 默认行为基本上相同。
- API变更(#26和#22) 
- 支持解析ws/wss URL(#22) 
- 添加get_port方法(#25) 
- 添加get_scheme方法(#20) 
- 在setup.py中正确声明许可证(#24) 
0.6.0 (2020-04-06)
- 使用tldextract解析域名(#12) 
- 使用numpy风格的docstrings 
- 支持URL中没有方案和端口的场景(#13) 
0.5.0 (2020-04-03)
- 移除对Python 3.5的支持 
- 在get_stripped_url中处理更多情况并更改默认行为 - 处理缺少方案的情况 
- 布尔标志,用于返回或返回非HTTP URL - 默认为返回,这是行为的变化,因为在之前它们不会返回 
- 默认使用netloc而不是hostname,通过布尔标志可以使用hostname。 
 
0.4.0 (2020-03-25)
- 移除py27支持 
0.3.0 (2020-03-25)
- 恢复py27支持。 
- 最后一个具有py27支持的版本。 
- 移除tox 
0.2.0 (2020-03-24)
- 从https://github.com/mozilla/openwpm-utils/blob/master/openwpm_utils/domain.py提取 
- 移除python 2支持和依赖项 
- 移除损坏的get_stripped_urls函数 
- 首次在PyPI上发布。 
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定要选择哪个,请了解更多关于安装包的信息。