用于在文本数据中搜索域名名的库
项目描述
find_domains 文档
此库用于在原始文本数据中搜索域名。首先,它使用简单的正则表达式搜索类似域名的字符串。然后,它使用顶级域名列表来删除可能为域名名称的名称,即最后一部分不是顶级域名。TLD列表由tldextract库提供,这从技术上意味着当您第一次使用find_domains
时,它将下载顶级域名列表(这是tldextract的行为)。
安装
pip install -U find_domains
用法
from find_domains import find_domains
data = """
foo bar google.com foo.bar.com domain.info
превед-медвед.рф
"""
for domain in find_domains(data):
print(domain)