跳转到主要内容

一个用于生成实体指纹的库。

项目描述

fingerprints

package

这个库帮助生成实体数据的指纹。在这个上下文中,指纹被视为简化后的实体标识符,由其名称或地址生成,用于在不同数据集之间进行实体交叉引用。

用法

import fingerprints

fp = fingerprints.generate('Mr. Sherlock Holmes')
assert fp == 'holmes sherlock'

fp = fingerprints.generate('Siemens Aktiengesellschaft')
assert fp == 'ag siemens'

fp = fingerprints.generate('New York, New York')
assert fp == 'new york'

公司类型名称

指纹库的一个重要功能是识别公司法律形式名称。例如,指纹库可以将 Общество с ограниченной ответственностью 简化为 ООО,或将 Aktiengesellschaft 简化为 AG。所需数据库基于两个不同的来源

维基百科还维护着 企业实体类型索引

另请参阅

  • 深入探讨聚类,这是 OpenRefine 文档的一部分,讨论了如何在数据聚类中创建冲突。
  • probablepeople,由 datamade.us 的杰出人士制作的西方姓名解析器。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

fingerprints-1.2.3.tar.gz (16.3 kB 查看哈希值)

上传日期 源代码

构建分发

fingerprints-1.2.3-py2.py3-none-any.whl (17.1 kB 查看哈希值)

上传日期 Python 2 Python 3

由以下组织支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面