为国家和文本标记名称。
项目描述
countrytagger
这个库在文本字符串中查找地点名称,并尝试将它们与国家关联起来。目标是给文本的一部分(或一组)标记国家元数据。地点名称来自GeoNames数据库,包括国家、主要行政区域和大型城市的名称。在多个国家使用的地点名称不被使用。
使用方法
import countrytagger
# match in a string using sequential matching:
text = 'I am in Berlin'
for (code, score, country) in countrytagger.tag_text_countries(text):
print(score, country)
# find precise matches:
code, score, country = countrytagger.tag_place('Berlin')
构建数据
您可以像这样重新生成地点数据库
$ make generate
这将下载GeoNames并将其解析为此库使用的格式。
项目详情
下载文件
下载适合您平台的文件。如果您不确定要选择哪一个,请了解更多关于安装包的信息。
源分布
countrytagger-0.1.2.tar.gz (693.7 kB 查看哈希值)
构建分布
countrytagger-0.1.2-py2.py3-none-any.whl (703.9 kB 查看哈希值)
关闭
countrytagger-0.1.2.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | aeb5e9e01dd824c4499b9c12ba06b6967cd3aee26ee7518958a435832a8b7701 |
|
MD5 | e8c11044d36c8be1fd83da2e667064d1 |
|
BLAKE2b-256 | 6973d9383acb6052226acc64572278067f9c9258acc570efc41ea30f3fa5a5e1 |