跳转到主要内容

一个用于在HTML数据上创建统计NER系统的库

项目描述

PyPI Version Build Status Code Coverage Documentation

Webstruct是一个用于创建统计NER系统的库,该系统适用于HTML数据,即用于构建从网页中提取命名实体(地址、组织名称、营业时间等)的工具的库。

与大多数NER系统不同,webstruct在HTML数据上工作,而不仅是在文本数据上。这允许定义使用HTML结构的功能,并且还可以将标注结果嵌入回HTML中。

阅读文档获取更多信息。

许可证是MIT。

贡献

要运行测试,请确保已安装tox,然后从源根目录运行tox

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解安装包的更多信息。

源分布

webstruct-0.6.tar.gz (48.3 kB 查看散列)

上传时间

构建分布

webstruct-0.6-py2.py3-none-any.whl (63.0 kB 查看散列)

上传时间 Python 2 Python 3

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面