跳转到主要内容

一个用于执行shingling和LSH的Python库。

项目描述

hlwy-lsh

LSH是使用minhash实现的Python本地敏感哈希库。它对于检测近似重复文档非常有用。

实现使用MurmurHash v3库来创建文档指纹。

如果您想重新生成哈希和shingling代码的.cpp文件,则需要Cython。默认情况下,安装脚本使用预生成的.cpp源文件,您可以在setup.py中使用USE_CYTHON标志来更改此设置

运行代码需要NumPy。

MurmurHash3库采用MIT许可协议分发。更多信息请访问 https://github.com/aappleby/smhasher

安装

$ pip install hlwy-lsh
…

✨🍰✨

项目详情


下载文件

下载适用于您的平台文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分发

hlwy-lsh-0.3.6.tar.gz (126.4 kB 查看散列)

上传时间:

由以下支持