顶级域名 · PyPI · Python 包索引

从给定的URL中提取顶级域名（TLD）。

这些详情尚未由PyPI 验证

项目链接

项目描述

从给定的URL中提取顶级域名（TLD）。TLD名称列表来自公共后缀。

可选地，在非存在的TLD上抛出异常或在设置fail_silently参数为True时静默失败。

MPL-1.1 OR GPL-2.0-only OR LGPL-2.1-or-later

先决条件

Python 3.7, 3.8, 3.9, 3.10或3.11。

文档

文档可在Read the Docs上找到。

安装

PyPI上的最新稳定版本

pip install tld

或GitHub上的最新稳定版本

pip install https://github.com/barseghyanartur/tld/archive/stable.tar.gz

使用示例

除了下面的示例外，请参阅jupyter notebook工作簿文件。

从给定的URL中获取TLD名称作为字符串

from tld import get_tld

get_tld("http://www.google.co.uk")
# 'co.uk'

get_tld("http://www.google.idontexist", fail_silently=True)
# None

获取TLD 作为对象

from tld import get_tld

res = get_tld("http://some.subdomain.google.co.uk", as_object=True)

res
# 'co.uk'

res.subdomain
# 'some.subdomain'

res.domain
# 'google'

res.tld
# 'co.uk'

res.fld
# 'google.co.uk'

res.parsed_url
# SplitResult(
#     scheme='http',
#     netloc='some.subdomain.google.co.uk',
#     path='',
#     query='',
#     fragment=''
# )

获取TLD名称，忽略缺失的协议

from tld import get_tld, get_fld

get_tld("www.google.co.uk", fix_protocol=True)
# 'co.uk'

get_fld("www.google.co.uk", fix_protocol=True)
# 'google.co.uk'

返回TLD部分作为元组

from tld import parse_tld

parse_tld('http://www.google.com')
# 'com', 'google', 'www'

从给定的URL中获取一级域名作为字符串

from tld import get_fld

get_fld("http://www.google.co.uk")
# 'google.co.uk'

get_fld("http://www.google.idontexist", fail_silently=True)
# None

检查某个顶级域名是否为有效顶级域名

from tld import is_tld

is_tld('co.uk)
# True

is_tld('uk')
# True

is_tld('tld.doesnotexist')
# False

is_tld('www.google.com')
# False

更新顶级域名名称列表

要更新/同步顶级域名名称与最新版本，请在终端运行以下命令

update-tld-names

或者简单地进行以下操作

from tld.utils import update_tld_names

update_tld_names()

注意，这将更新所有注册的顶级域名源解析器（而不仅仅是Mozilla获取的顶级域名名称列表）。为了运行单个解析器的更新，将那个解析器的uid作为参数追加。

update-tld-names mozilla

自定义顶级域名解析器

默认情况下，顶级域名名称列表从Mozilla获取。解析实现在tld.utils.MozillaTLDSourceParser类中。如果您想使用另一个解析器，可以继承tld.base.BaseTLDSourceParser，提供uid、source_url、local_path并实现get_tld_names方法。以tld.utils.MozillaTLDSourceParser作为此类实现的良好示例。然后您可以使用get_tld（以及其他tld模块函数），如下所示

from tld import get_tld
from some.module import CustomTLDSourceParser

get_tld(
    "http://www.google.co.uk",
    parser_class=CustomTLDSourceParser
)

自定义顶级域名名称列表

您可以维护自己的顶级域名名称列表版本（甚至多个），同时与内置的顶级域名名称列表一起使用。

然后您可以将它们存储在本地，并提供如下路径

from tld import get_tld
from tld.utils import BaseMozillaTLDSourceParser

class CustomBaseMozillaTLDSourceParser(BaseMozillaTLDSourceParser):

    uid: str = 'custom_mozilla'
    local_path: str = 'tests/res/effective_tld_names_custom.dat.txt'

get_tld(
    "http://www.foreverchild",
    parser_class=CustomBaseMozillaTLDSourceParser
)
# 'foreverchild'

同样适用于一级域名

from tld import get_fld

get_fld(
    "http://www.foreverchild",
    parser_class=CustomBaseMozillaTLDSourceParser
)
# 'www.foreverchild'

注意，在上述两个示例中，原始顶级域名名称文件已按以下方式进行修改

...
// ===BEGIN ICANN DOMAINS===

// This one actually does not exist, added for testing purposes
foreverchild
...

释放资源

为了释放由自定义顶级域名名称加载所占用的内存，使用带有tld_names_local_path参数的reset_tld_names函数。

from tld import get_tld, reset_tld_names

# Get TLD from a custom TLD names parser
get_tld(
    "http://www.foreverchild",
    parser_class=CustomBaseMozillaTLDSourceParser
)

# Free resources occupied by the custom TLD names list
reset_tld_names("tests/res/effective_tld_names_custom.dat.txt")

故障排除

如果在此处列出的域名名称无法识别，请确保您虚拟环境中具有最新的顶级域名名称版本

update-tld-names

要为单个解析器更新顶级域名名称列表，请指定它作为参数

update-tld-names mozilla

测试

只需输入

pytest

或者使用tox

tox

或者使用tox来检查特定环境

tox -e py39

编写文档

保持以下层次结构。

=====
title
=====

header
======

sub-header
----------

sub-sub-header
~~~~~~~~~~~~~~

sub-sub-sub-header
^^^^^^^^^^^^^^^^^^

sub-sub-sub-sub-header
++++++++++++++++++++++

sub-sub-sub-sub-sub-header
**************************

许可证

MPL-1.1 OR GPL-2.0-only OR LGPL-2.1-or-later

支持

有关安全问题，请联系作者部分提供的电子邮件。

有关总体问题，请访问GitHub。

作者

Artur Barseghyan <artur.barseghyan@gmail.com>

项目详情

这些详情尚未由PyPI 验证

项目链接

发布历史发布通知 | RSS源

本版本

0.13

2023年2月27日

0.12.7

2023年2月2日

0.12.6

2021年6月6日

0.12.5

2021年1月11日

0.12.4

2021年1月2日

0.12.3

2020年11月26日

0.12.2

2020年5月20日

0.12.1

2020年4月25日

0.12

2020年4月19日

0.11.11

2020年3月10日

0.11.10

2020年2月5日

0.11.9

2019年12月16日

0.11.8

2019年12月13日

0.11.7

2019年12月12日

0.11.6

2019年12月12日

0.11.5

2019年12月11日

0.11.4

2019年12月11日

0.11.3

2019年12月11日

0.11.2

2019年12月11日

0.11.1

2019年12月10日

0.11

2019年12月9日

0.10

2019年11月27日

0.9.8

2019年11月15日

0.9.7

2019年10月30日

0.9.6

2019年9月12日

0.9.5

2019年9月11日

0.9.4

2019年9月10日

0.9.3

2019年4月6日

0.9.2

2019年1月10日

0.9.1

2018年7月9日

0.9

2018年6月13日

0.8

2018年6月13日

0.7.10

2018年4月7日

0.7.9

2017年5月2日

0.7.8

2017年2月19日

0.7.7

2017年2月9日

0.7.6

2016年1月23日

0.7.5

2015年11月22日

0.7.4

2015年9月23日

0.7.3

2015年7月18日

0.7.2

2014年9月28日

0.7.1

2014年9月22日

0.7

2014年8月14日

0.6.4

2014年5月22日

0.6.3

2013年12月5日

0.6.2

2013年12月3日

0.6.1

2013年9月15日

0.5

2013年9月7日

0.4

2013年8月3日

0.3

2013年7月29日

0.2

2013年5月11日

下载文件

下载适合您平台的文件。如果您不确定该选择哪一个，请了解更多关于安装包的信息。

源代码分发

tld-0.13.tar.gz (446.8 kB 查看哈希值)

上传时间 2023年2月27日 源代码

构建分发

tld-0.13-py2.py3-none-any.whl (263.8 kB 查看哈希值)

上传时间 2023年2月27日 Python 2 Python 3

tld-0.13.tar.gz的哈希值

tld-0.13.tar.gz的哈希值
算法	哈希摘要
SHA256	`93dde5e1c04bdf1844976eae440706379d21f4ab235b73c05d7483e074fb5629`
MD5	`6e43346e0188919bdd9eca2653d9c56b`
BLAKE2b-256	`192b678082222bc1d2823ea8384c6806085b85226ff73885c703fe0c7143ef64`

tld-0.13-py2.py3-none-any.whl的哈希值

tld-0.13-py2.py3-none-any.whl的哈希值
算法	哈希摘要
SHA256	`f75b2be080f767ed17c2338a339eaa4fab5792586319ca819119da252f9f3749`
MD5	`1d916491723cd1682c1a9cc0d5ebb53c`
BLAKE2b-256	`ea75779ddeaf4d847ba0021ad99d1b615a853f2a5762bd5d118273c7f7673c38`

tld 0.13

导航

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

先决条件

文档

安装

使用示例

从给定的URL中获取TLD名称作为字符串

获取TLD 作为对象

获取TLD名称，忽略缺失的协议

返回TLD部分作为元组

从给定的URL中获取一级域名作为字符串

检查某个顶级域名是否为有效顶级域名

更新顶级域名名称列表

自定义顶级域名解析器

自定义顶级域名名称列表

释放资源

故障排除

测试

编写文档

许可证

支持

作者

项目详情

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史发布通知 | RSS源

下载文件

源代码分发

构建分发

tld 0.13

导航

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

先决条件

文档

安装

使用示例

从给定的URL中获取TLD名称 作为字符串

获取TLD 作为对象

获取TLD名称，忽略缺失的协议

返回TLD部分作为元组

从给定的URL中获取一级域名作为字符串

检查某个顶级域名是否为有效顶级域名

更新顶级域名名称列表

自定义顶级域名解析器

自定义顶级域名名称列表

释放资源

故障排除

测试

编写文档

许可证

支持

作者

项目详情

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS源

下载文件

源代码分发

构建分发

从给定的URL中获取TLD名称作为字符串

发布历史发布通知 | RSS源