跳转到主要内容

在文本中识别巴西地区 🏘

项目描述

tomBa

Built with spaCy CI

在文本中识别地址、街区和其他巴西地区。 🏘

不知道什么是Tomba


这个库是实验性的,目前处于开发初期阶段。

目标

import tomba


tomba.get_locations(
    "Contratação de empresa de engenharia para executar obras "
    "de pavimentação localizados no CEP 44100-000, no bairro Tomba."
)

输出

[
    {"type": "zipcode", "start": 92, "end": 123},
    {"type": "neighborhood", "start": 113, "end": 118}
]

开发

我们使用poetry进行打包和依赖管理。

要安装依赖项,请执行poetry install

要配置葡萄牙语的spacy,请执行

poetry run python -m spacy download pt_core_news_sm

要运行测试

poetry run pytest

要生成新模型

poetry run python tomba/models.py

项目详情


下载文件

下载适用于您平台文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

tomba-0.1.1a1.tar.gz (16.1 kB 查看哈希值)

上传时间:

构建分布

tomba-0.1.1a1-py3-none-any.whl (17.0 kB 查看哈希值)

上传时间: Python 3

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页