从URL中提取域的实用函数集合。
项目描述
domain_utils
从URL中提取域的实用函数集合。
仓库: https://github.com/mozilla/domain_utils
安装
pip install domain_utils
使用
import domain_utils as du # Return just the url `my.domain.cloudfront.net/a/path/to/a/file.html` du.stem_url('https://my.domain.cloudfront.net/a/path/to/a/file.html?a=1') # Return just the eTLD+1 `domain.cloudfront.net` du.get_etld1('https://my.domain.cloudfront.net/a/path/to/a/file.html?a=1') # Get the port `5000` du.get_port('https://localhost:5000/a/path/to/a/file.html?a=1') # Get the scheme `wss` du.get_port('wss://somedomain.example.com/a/path/to/a/ws')
此软件包最初是从 openwpm-utils 中提取出来的。
自由软件:Mozilla公共许可证
社区参与指南
该项目受Mozilla的行为准则和礼仪指南管理。
如需了解更多详情,请阅读Mozilla社区参与指南。
有关如何报告违反社区参与指南的信息,请参阅我们的如何报告页面。
历史
0.7.1 (2020-04-10)
修复在readthedocs上的构建问题。
0.7.0 (2020-04-10)
感谢新贡献者@yabirgb在本版本中提交的两个PR(#20和#25)。
API变更:#26将< cite>get_stripped_url重命名为< cite>stem_url,将< cite>get_ps_plus_1重命名为< cite>get_etld1。尽管如此,旧方法名称将继续有效。#22更新了< cite>get_stripped_url的关键字参数 - 默认行为基本上相同。
API变更(#26和#22)
支持解析ws/wss URL(#22)
添加get_port方法(#25)
添加get_scheme方法(#20)
在setup.py中正确声明许可证(#24)
0.6.0 (2020-04-06)
使用tldextract解析域名(#12)
使用numpy风格的docstrings
支持URL中没有方案和端口的场景(#13)
0.5.0 (2020-04-03)
移除对Python 3.5的支持
在get_stripped_url中处理更多情况并更改默认行为
处理缺少方案的情况
布尔标志,用于返回或返回非HTTP URL - 默认为返回,这是行为的变化,因为在之前它们不会返回
默认使用netloc而不是hostname,通过布尔标志可以使用hostname。
0.4.0 (2020-03-25)
移除py27支持
0.3.0 (2020-03-25)
恢复py27支持。
最后一个具有py27支持的版本。
移除tox
0.2.0 (2020-03-24)
从https://github.com/mozilla/openwpm-utils/blob/master/openwpm_utils/domain.py提取
移除python 2支持和依赖项
移除损坏的get_stripped_urls函数
首次在PyPI上发布。
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定要选择哪个,请了解更多关于安装包的信息。