一个用于执行shingling和LSH的Python库。
项目描述
hlwy-lsh
LSH是使用minhash实现的Python本地敏感哈希库。它对于检测近似重复文档非常有用。
实现使用MurmurHash v3库来创建文档指纹。
如果您想重新生成哈希和shingling代码的.cpp文件,则需要Cython。默认情况下,安装脚本使用预生成的.cpp源文件,您可以在setup.py中使用USE_CYTHON标志来更改此设置
运行代码需要NumPy。
MurmurHash3库采用MIT许可协议分发。更多信息请访问 https://github.com/aappleby/smhasher
安装
$ pip install hlwy-lsh
…
✨🍰✨
项目详情
    
       关闭
    
      
        
    
    
  
hlwy-lsh-0.3.6.tar.gz的散列
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | b845bc7f74979bf4a0a8b02b747c68508e3c73a205827e737a3f370c2ef879d7 | |
| MD5 | 8ae4ecf6c3e1669b54dc24e5bf2e7922 | |
| BLAKE2b-256 | bbd49e298f081e84d8af940e35c8e7684ec54b5b4cf5388479a6fb5e5e7340ab |