跳转到主要内容

从URL中提取域的实用函数集合。

项目描述

domain_utils

https://img.shields.io/pypi/v/domain_utils.svg CircleCI Documentation Status

从URL中提取域的实用函数集合。

仓库: https://github.com/mozilla/domain_utils

安装

pip install domain_utils

使用

import domain_utils as du
# Return just the url `my.domain.cloudfront.net/a/path/to/a/file.html`
du.stem_url('https://my.domain.cloudfront.net/a/path/to/a/file.html?a=1')
# Return just the eTLD+1 `domain.cloudfront.net`
du.get_etld1('https://my.domain.cloudfront.net/a/path/to/a/file.html?a=1')
# Get the port `5000`
du.get_port('https://localhost:5000/a/path/to/a/file.html?a=1')
# Get the scheme `wss`
du.get_port('wss://somedomain.example.com/a/path/to/a/ws')

此软件包最初是从 openwpm-utils 中提取出来的。

社区参与指南

该项目受Mozilla的行为准则和礼仪指南管理。

如需了解更多详情,请阅读Mozilla社区参与指南

有关如何报告违反社区参与指南的信息,请参阅我们的如何报告页面。

历史

0.7.1 (2020-04-10)

修复在readthedocs上的构建问题。

0.7.0 (2020-04-10)

感谢新贡献者@yabirgb在本版本中提交的两个PR(#20和#25)。

API变更:#26将< cite>get_stripped_url重命名为< cite>stem_url,将< cite>get_ps_plus_1重命名为< cite>get_etld1。尽管如此,旧方法名称将继续有效。#22更新了< cite>get_stripped_url的关键字参数 - 默认行为基本上相同。

  • API变更(#26和#22)

  • 支持解析ws/wss URL(#22)

  • 添加get_port方法(#25)

  • 添加get_scheme方法(#20)

  • 在setup.py中正确声明许可证(#24)

0.6.0 (2020-04-06)

  • 使用tldextract解析域名(#12)

  • 使用numpy风格的docstrings

  • 支持URL中没有方案和端口的场景(#13)

0.5.0 (2020-04-03)

  • 移除对Python 3.5的支持

  • 在get_stripped_url中处理更多情况并更改默认行为

    • 处理缺少方案的情况

    • 布尔标志,用于返回或返回非HTTP URL - 默认为返回,这是行为的变化,因为在之前它们不会返回

    • 默认使用netloc而不是hostname,通过布尔标志可以使用hostname。

0.4.0 (2020-03-25)

  • 移除py27支持

0.3.0 (2020-03-25)

  • 恢复py27支持。

  • 最后一个具有py27支持的版本。

  • 移除tox

0.2.0 (2020-03-24)

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定要选择哪个,请了解更多关于安装包的信息。

源分布

domain_utils-0.7.1.tar.gz (25.5 kB 查看散列

上传时间

构建分布

domain_utils-0.7.1-py2.py3-none-any.whl (11.8 kB 查看散列

上传时间 Python 2 Python 3

支持者:

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面