一个基于WikiProjects自动检测维基百科新草案主题的库。
项目描述
# 草案主题
根据英语维基百科上的WikiProjects预测新草案的主题。
## 设置
确保有一个工作的python3环境。使用以下命令安装需求:
` pip install -r requirements `
使用以下命令安装库:
` python setup.py install `
## 生成机器可读的WikiProjects数据
从根目录使用以下实用工具生成机器可读的WikiProjects数据
` ./utility fetch_wikiprojects --output <output_file_name.json> `
## 生成中级类别到WikiProjects的映射
从根目录使用以下实用工具生成高级主题类别到包含其中的WikiProjects列表的映射
` ./utility trim_wikiprojects --wikiprojects wp --output outmid `
## 对一系列页面ID进行标记,标记每个页面所属的WikiProjects和中级类别
从根目录使用以下实用工具对一系列页面ID进行标记,标记每个页面所属的WikiProjects和中级类别。
` ./utility fetch_page_wikiprojects --api-host=https://en.wikipedia.org/ --input=wikiproject_page_ids.json --output=enwiki.labeled_wikiprojects.json --mid_level_wp=outmid.json --verbose `
在上文中,脚本的输入应该是一个包含观测列表的json,每个观测都有一个 page_id: <page-id> 映射。此外,还需要传递一个用于生成维基项目到中等级别分类映射的中级维基项目json。脚本将提到的字段添加到给定的列表中,并将它们写入由 “output” 指定的新文件。
## 在维基百科上为一系列页面ID生成预测
为了生成一系列修订ID的主题预测,下载相关的模型并使用revscoring的[score](https://github.com/wikimedia/revscoring/blob/master/revscoring/utilities/score.py) API来生成预测。注意,修订ID需要在一个由API指定的格式文件中。使用页面最近修订的修订ID来获取良好的预测。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源分发
构建分发
drafttopic-0.4.1.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | f85d58d1cf4d3e0eab78c7adef623924c461647c9b504a9c41935367a875a412 |
|
MD5 | 04d62df18f1cf42187635b0c26a5797c |
|
BLAKE2b-256 | 3708d01d5c452367974ef72232fbb92c8d8c5034fb568e18845857a685bde03b |
drafttopic-0.4.1-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 78e0f65188e41232f2ac5c3970848e44739a1bf3c9217187f144a1b767af217f |
|
MD5 | 1e35240f01fb0993e0f4e8a2a1f5f8d7 |
|
BLAKE2b-256 | 6edde4f986bdd5ee5c2ac8c4969bb31e9faceca20ee14ada8115cd6884b1fbbd |