一个用于执行shingling和LSH的Python库。
项目描述
hlwy-lsh
LSH是使用minhash实现的Python本地敏感哈希库。它对于检测近似重复文档非常有用。
实现使用MurmurHash v3库来创建文档指纹。
如果您想重新生成哈希和shingling代码的.cpp文件,则需要Cython。默认情况下,安装脚本使用预生成的.cpp源文件,您可以在setup.py中使用USE_CYTHON标志来更改此设置
运行代码需要NumPy。
MurmurHash3库采用MIT许可协议分发。更多信息请访问 https://github.com/aappleby/smhasher
安装
$ pip install hlwy-lsh
…
✨🍰✨
项目详情
关闭
hlwy-lsh-0.3.6.tar.gz的散列
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b845bc7f74979bf4a0a8b02b747c68508e3c73a205827e737a3f370c2ef879d7 |
|
MD5 | 8ae4ecf6c3e1669b54dc24e5bf2e7922 |
|
BLAKE2b-256 | bbd49e298f081e84d8af940e35c8e7684ec54b5b4cf5388479a6fb5e5e7340ab |