获取各种语言的常见停用词列表(Python版)
项目描述
概述
在Python中获取各种语言的常见停用词列表。
支持的语言
阿拉伯语
保加利亚语
加泰罗尼亚语
捷克语
丹麦语
荷兰语
英语
芬兰语
法语
德语
匈牙利语
印尼语
意大利语
挪威语
波兰语
葡萄牙语
罗马尼亚语
俄语
西班牙语
瑞典语
土耳其语
乌克兰语
安装
stop-words 已在PyPI上提供
http://pypi.python.org/pypi/stop-words
通过 pip 轻松安装它
$ pip install stop-words
或通过 easy_install
$ easy_install stop-words
另一种方法是克隆 stop-words 的 git仓库
$ git clone --recursive git://github.com/Alir3z4/python-stop-words.git
然后运行以下命令进行安装
$ python setup.py install
基本用法
from stop_words import get_stop_words stop_words = get_stop_words('en') stop_words = get_stop_words('english') from stop_words import safe_get_stop_words stop_words = safe_get_stop_words('unsupported language')
Python兼容性
Python-stop-words最初是为Python 2开发的,但已移植并针对Python 3进行了测试。
项目详情
关闭
stop-words-2018.7.23.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 6df3ad5f5de697daa437e4445c86c73604e6bc138dd0dc0fac55664aa4e6b03e |
|
MD5 | 5381c1b83b3ee5984c26eecb065db86a |
|
BLAKE2b-256 | 1ccbd58290804b7a4c5daa42abbbe2a93c477ae53e45541b1825e86f0dfaaf63 |