跳转到主要内容

一个用于自动检测维基百科文章评估类的库。

项目描述

维基百科文章质量分类

此库提供了一组用于自动检测维基百科文章评估类的实用工具。有关更多信息,请参阅完整的文档https://articlequality.readthedocs.io

仅兼容Python 3.x。抱歉。

基本用法

>>> import articlequality
>>> from revscoring import Model
>>>
>>> scorer_model = Model.load(open("models/enwiki.nettrom_wp10.gradient_boosting.model", "rb"))
>>>
>>> text = "I am the text of a page.  I have a <ref>word</ref>"
>>> articlequality.score(scorer_model, text)
{'prediction': 'stub',
 'probability': {'stub': 0.27156163795807853,
                 'b': 0.14707452309674252,
                 'fa': 0.16844898943510833,
                 'c': 0.057668704007171959,
                 'ga': 0.21617801281707663,
                 'start': 0.13906813268582238}}

安装

需求

  • Python 3.5, 3.6 或 3.7
  • revscoring 的所有系统要求revscoring

安装步骤

  1. 克隆此仓库
  2. 安装包及其依赖项 python setup.py install
  3. 您可以通过运行 make enwiki_models 来构建英语维基百科文章质量模型,或者运行 make wikidatawiki_models 来构建 Wikidata 的项目质量模型,以验证您的安装是否成功。

重新训练模型

要重新训练一个模型,运行 make -B MODEL,例如 make -B wikidatawiki_models。这将重新下载标签,从修订中提取特征,然后重新训练和重新评分模型。

要跳过重新下载训练标签和重新提取特征,只需在 datasets/ 目录中创建文件并运行不带 -B 标志的 make 命令即可。

运行测试

示例

pytest -vv tests/feature_lists/test_wikidatawiki.py

作者

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

articlequality-0.4.4.tar.gz (37.0 kB 查看哈希值)

上传时间 源代码

构建分发

articlequality-0.4.4-py2.py3-none-any.whl (56.1 kB 查看哈希值)

上传时间 Python 2 Python 3

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面