基于SpaCy的文本和标签联合增强的库。
项目描述
Augmenty:您NLP管道的完美之选
Augmenty是一个基于spaCy的文本增强库。除了提供一系列高度灵活的增强器之外,Augmenty还提供了一系列用于处理增强器的工具,包括组合和调节增强器。与其他增强库不同,Augmenty在增强过程中尽可能纠正分配的标签,从而使许多增强器适用于更广泛任务的训练。
🔧 安装
要开始使用augmenty,请通过在终端中运行以下行使用pip进行安装:
pip install augmenty
请注意,这是一个最小化安装。由于一些augmenters需要额外的包,请写入以下行以安装所有依赖项。
pip install "augmenty[all]"
有关安装augmenty的更多详细说明,包括特定语言支持,请参阅安装说明。
🍒 简单示例
以下展示如何使用Augmenty快速增强文本的简单示例。有关使用augmenty的更多信息,请参阅使用指南。
import spacy
import augmenty
nlp = spacy.load("en_core_web_md")
# if not installed run: python -m spacy download en_core_web_md
docs = nlp.pipe(["Augmenty is a great tool for text augmentation"])
entity_augmenter = augmenty.load("ents_replace_v1",
ent_dict = {"ORG": [["spaCy"], ["spaCy", "Universe"]]}, level=1)
for doc in augmenty.docs(docs, augmenter=entity_augmenter, nlp=nlp):
print(doc)
spaCy Universe is a great tool for text augmentation.
📖 文档
文档 | |
---|---|
📚 使用指南 | 有关如何使用augmenty及其功能的指南和说明。 |
📰 新闻和更新日志 | 新增功能、更改和版本历史。 |
🎛 API参考 | augmenty API的详细参考。包括函数文档 |
🍒 Augmenters | 包含augmenty中所有当前augmenters的完整列表。 |
🙋 常见问题解答 | 有关augmenty的常见问题解答 |
💬 哪里提问
类型 | |
---|---|
🚨 错误报告 | GitHub问题跟踪器 |
🎁 功能请求和想法 | GitHub问题跟踪器 |
👩💻 使用问题 | GitHub讨论 |
🗯 一般讨论 | GitHub讨论 |
🍒 添加Augmenter | 添加augmenter |
项目详情
下载文件
下载适合您平台的应用文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源分布
augmenty-1.4.4.tar.gz (1.3 MB 查看哈希值)
构建分布
augmenty-1.4.4-py3-none-any.whl (47.1 kB 查看哈希值)
关闭
augmenty-1.4.4.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | f493d586db2ed347a02afaaa27a236ca3e29416e8be98fcc33ad3c263de558ad |
|
MD5 | c7c8ff88db0d2f0f74b02a750d4cac64 |
|
BLAKE2b-256 | 26e44ff5f09a33d2599b7d92b9659cfaf151db90e28b4d5d9928d170f94208d2 |