跳转到主要内容

一个用于在HTML数据上创建统计NER系统的库

项目描述

PyPI Version Build Status Code Coverage Documentation

Webstruct是一个用于创建统计NER系统的库,该系统适用于HTML数据,即用于构建从网页中提取命名实体(地址、组织名称、营业时间等)的工具的库。

与大多数NER系统不同,webstruct在HTML数据上工作,而不仅是在文本数据上。这允许定义使用HTML结构的功能,并且还可以将标注结果嵌入回HTML中。

阅读文档获取更多信息。

许可证是MIT。

贡献

要运行测试,请确保已安装tox,然后从源根目录运行tox

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面