Levenshtein编辑距离库
项目描述
Python的Levenshtein编辑距离库,Apache许可。由荷兰eScience Center的Lars Buitinck编写,由阿姆斯特丹大学的Isaac Sijaranamual贡献。
对字节字符串或Unicode码点执行距离计算。
安装
确保已安装Cython和C++编译器
pip install cython
安装C++编译器非常依赖于平台,因此我不会显示指令。请咨询您的包管理器。
然后
python setup.py install
要运行测试,但不是使用leven,您需要six和Nose。
用法
>>> from leven import levenshtein >>> levenshtein("hello, world!", "goodbye, cruel world!") 13
关于实现
核心算法是用C++实现的。我使用它而不是C来获得模板、更简单的内存管理和更好的标准库,因此C++代码可能看起来像C代码。
待办事项
实现Ukkonen的有界Levenshtein距离算法
实现Levenshtein自动机以在字符串空间中进行快速邻域搜索
实现加权Levenshtein距离
项目详情
关闭
leven-1.0.4.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 732474a3b9e94003aab61fd57eb2cbdaf0ed32f9a85b63073bcc4fa1ed5d0aff |
|
MD5 | 65bcec29cec3ccd8a053c97bd2a711e3 |
|
BLAKE2b-256 | 730237084115516cfd595ee2f9a873fffe8b85c6b1538523ff6a8b8dd7ff7d46 |