pip install mwtextextractor 复制PIP说明
发布时间: 2018年9月23日
通过去除模板、HTML标签、表格、标题等从MediaWiki wikitext中提取正文文本。
mwtextextractor通过去除模板、HTML标签、表格、标题等从MediaWiki wikitext中提取简单的正文文本。提取的文本可用于单词计数。
示例
from mwtextextractor import get_body_text print get_body_text('Lorem {{ipsum}} dolor')
0.1.3
2018年9月23日
0.1.2
2018年4月4日
0.1
2013年5月12日
下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
上传时间:2018年9月23日 源
源
上传时间:2018年9月23日 Python 2 Python 3
Python 2
Python 3
014893a4c881c69cbe0459caad85e0f33e64f4485133342bc42ea4550d098b08
795f69eee640e6a329ff28cd6bb8ccfb
c397a716b7fb8124a36bc25567ba95e865d49c27fdcf71a9d9400b58b7131843
f3c59a0a13d8bf688057aa5d427ff3de2b6fef820b7812b1e4eaeedbfec77ec1
288aae2f24572200d78c882807307bec
253925023b748b78eb95605e27e4df8d3b3d166743afca6f1779fd23392cac42
由以下机构支持