跳转到主要内容

Levenshtein编辑距离库

项目描述

Python的Levenshtein编辑距离库,Apache许可。由荷兰eScience Center的Lars Buitinck编写,由阿姆斯特丹大学的Isaac Sijaranamual贡献。

对字节字符串或Unicode码点执行距离计算。

安装

确保已安装Cython和C++编译器

pip install cython

安装C++编译器非常依赖于平台,因此我不会显示指令。请咨询您的包管理器。

然后

python setup.py install

要运行测试,但不是使用leven,您需要six和Nose。

用法

>>> from leven import levenshtein
>>> levenshtein("hello, world!", "goodbye, cruel world!")
13

关于实现

核心算法是用C++实现的。我使用它而不是C来获得模板、更简单的内存管理和更好的标准库,因此C++代码可能看起来像C代码。

待办事项

  • 实现Ukkonen的有界Levenshtein距离算法

  • 实现Levenshtein自动机以在字符串空间中进行快速邻域搜索

  • 实现加权Levenshtein距离

项目详情


下载文件

下载适用于您平台的应用程序文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

leven-1.0.4.tar.gz (20.2 kB 查看哈希值)

支持者