纯Python实现的Snowball词干提取器
项目描述
在Python中使用Snowball词干提取器的常规方法是使用pystemmer包,该包提供了Snowball C库的Python包装器。然而,在某些环境中Python C扩展有问题。因此,此包提供了Snowball词干提取算法的纯Python实现。
词干提取算法的实现是通过sbl2py将Snowball语言翻译为Python的。
安装
使用pip安装
pip install purestemmer
用法
通常,当可能时,您会更喜欢使用
try: import Stemmer except ImportError: # pystemmer is not available, use purestemmer instead import purestemmer as Stemmer
由于
有关如何使用词干提取算法的详细信息,请参阅
和之间的差异
purestemmer 仅在 Python 2.7 上进行了测试
purestemmer.Stemmer 实例是线程安全的
purestemmer 的平均速度比 pystemmer 慢约 100 倍
许可证
purestemmer 本身受 MIT 许可证 保护。底层的 Snowball 算法受 BSD-3 许可证 保护。请参阅 LICENSE 文件以获取详细信息。
项目详情
关闭
purestemmer-0.1.1.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 33587f8c3024f0a061a8e10ed6d5dd5594ee7ec27b32fe79abd3b954177ba5cd |
|
MD5 | 7a144e0b090298a9d145427e19ca9d0f |
|
BLAKE2b-256 | c4e6609a6154001b2ef37bf20d6137dc3d5d13b48949738c9d2e399ba330be4d |