跳转到主要内容

基于SpaCy的文本和标签联合增强的库。

项目描述

Augmenty:您NLP管道的完美之选

PyPI version python version Ruff github actions pytest github actions docs status

Augmenty是一个基于spaCy的文本增强库。除了提供一系列高度灵活的增强器之外,Augmenty还提供了一系列用于处理增强器的工具,包括组合和调节增强器。与其他增强库不同,Augmenty在增强过程中尽可能纠正分配的标签,从而使许多增强器适用于更广泛任务的训练。

🔧 安装

要开始使用augmenty,请通过在终端中运行以下行使用pip进行安装:

pip install augmenty

请注意,这是一个最小化安装。由于一些augmenters需要额外的包,请写入以下行以安装所有依赖项。

pip install "augmenty[all]"

有关安装augmenty的更多详细说明,包括特定语言支持,请参阅安装说明

🍒 简单示例

以下展示如何使用Augmenty快速增强文本的简单示例。有关使用augmenty的更多信息,请参阅使用指南

import spacy
import augmenty

nlp = spacy.load("en_core_web_md")
# if not installed run: python -m spacy download en_core_web_md

docs = nlp.pipe(["Augmenty is a great tool for text augmentation"])

entity_augmenter = augmenty.load("ents_replace_v1", 
                                 ent_dict = {"ORG": [["spaCy"], ["spaCy", "Universe"]]}, level=1)

for doc in augmenty.docs(docs, augmenter=entity_augmenter, nlp=nlp):
    print(doc)
spaCy Universe is a great tool for text augmentation.

📖 文档

文档
📚 使用指南 有关如何使用augmenty及其功能的指南和说明。
📰 新闻和更新日志 新增功能、更改和版本历史。
🎛 API参考 augmenty API的详细参考。包括函数文档
🍒 Augmenters 包含augmenty中所有当前augmenters的完整列表。
🙋 常见问题解答 有关augmenty的常见问题解答

💬 哪里提问

类型
🚨 错误报告 GitHub问题跟踪器
🎁 功能请求和想法 GitHub问题跟踪器
👩‍💻 使用问题 GitHub讨论
🗯 一般讨论 GitHub讨论
🍒 添加Augmenter 添加augmenter

项目详情


下载文件

下载适合您平台的应用文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

augmenty-1.4.4.tar.gz (1.3 MB 查看哈希值)

上传时间: 源代码

构建分布

augmenty-1.4.4-py3-none-any.whl (47.1 kB 查看哈希值)

上传时间: Python 3

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页