跳转到主要内容

在SpaCy上训练的丹麦管道,在丹麦的所有依存句法分析、命名实体识别和词性标注方面都达到了最先进性能

项目描述

DaCy:丹麦自然语言处理的高效且统一的框架

PyPI pip downloads Python Version Ruff documentation Tests

DaCy是一个使用SpaCy制作的丹麦自然语言预处理框架。其最大的管道在丹麦的命名实体识别、词性标注和依存句法分析方面都达到了最先进性能。您可以自由尝试演示。此存储库包含使用DaCy、重现结果和使用该软件包的指南。此外,它还包含对丹麦NLP管道偏差和鲁棒性的行为测试。

🔧 安装

您可以通过pipPyPI安装dacy

pip install dacy

👩‍💻 使用方法

要使用模型,您首先需要下载小型、中型或大型模型。要查看所有可用的模型列表

import dacy
for model in dacy.models():
    print(model)
# ...
# da_dacy_small_trf-0.2.0
# da_dacy_medium_trf-0.2.0
# da_dacy_large_trf-0.2.0

要下载和加载模型,只需执行

nlp = dacy.load("da_dacy_medium_trf-0.2.0")
# or equivalently (always loads the latest version)
nlp = dacy.load("medium")

要查看更多示例,请参阅文档

📖 文档

文档
📚 入门 关于如何使用DaCy及其功能的指南和说明。
🦾 性能 DaCy的性能详细描述以及与类似丹麦模型的比较。
📰 新闻和变更日志 新增功能、更改和版本历史。
🎛 API参考 DaCy API的详细参考。包括功能文档
🙋 常见问题解答 常见问题

训练和复制

“training”文件夹包含一系列文件夹,每个模型版本都有一个SpaCy项目。这允许复制结果。

想了解更多关于DaCy最初是如何产生的,请查看这篇博客文章


💬 提问的地方

要报告问题或请求功能,请使用GitHub问题跟踪器。有关SpaCy的问题请参阅SpaCy GitHub或论坛。否则,请使用讨论论坛。

类型
📚 常见问题解答 常见问题解答
🚨 错误报告 GitHub问题跟踪器
🎁 功能请求和想法 GitHub问题跟踪器
👩‍💻 使用问题 GitHub讨论
🗯 一般讨论 GitHub讨论

项目详情


下载文件

下载您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分发

dacy-2.7.7.tar.gz (4.2 MB 查看散列)

上传时间

构建分发

dacy-2.7.7-py3-none-any.whl (54.7 kB 查看散列)

上传时间 Python 3

由以下支持