跳转到主要内容

获取各种语言的常见停用词列表(Python版)

项目描述

概述

在Python中获取各种语言的常见停用词列表。

Build Status Coverage Status PyPI Version PyPI Wheel PyPI Status License PyPI Format PyPI Py_versions PyPI Downloads PyPI Implementation PyPI Egg

支持的语言

  • 阿拉伯语

  • 保加利亚语

  • 加泰罗尼亚语

  • 捷克语

  • 丹麦语

  • 荷兰语

  • 英语

  • 芬兰语

  • 法语

  • 德语

  • 匈牙利语

  • 印尼语

  • 意大利语

  • 挪威语

  • 波兰语

  • 葡萄牙语

  • 罗马尼亚语

  • 俄语

  • 西班牙语

  • 瑞典语

  • 土耳其语

  • 乌克兰语

安装

stop-words 已在PyPI上提供

http://pypi.python.org/pypi/stop-words

通过 pip 轻松安装它

$ pip install stop-words

或通过 easy_install

$ easy_install stop-words

另一种方法是克隆 stop-wordsgit仓库

$ git clone --recursive git://github.com/Alir3z4/python-stop-words.git

然后运行以下命令进行安装

$ python setup.py install

基本用法

from stop_words import get_stop_words

stop_words = get_stop_words('en')
stop_words = get_stop_words('english')

from stop_words import safe_get_stop_words

stop_words = safe_get_stop_words('unsupported language')

Python兼容性

Python-stop-words最初是为Python 2开发的,但已移植并针对Python 3进行了测试。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定该选择哪个,请了解有关安装包的更多信息。

源分发

stop-words-2018.7.23.tar.gz (31.5 kB 查看哈希值)

上传时间

由以下支持