跳转到主要内容

基于Ngram的字符串二进制文件索引

项目描述

此库允许将多个字符串索引到文件中,然后高效地模糊匹配索引的内容。

目前,结构是在内存中将Rust程序构建之后写入文件,因此该阶段会使用大量的RAM。您无法使用Python创建/更改索引。

字符串搜索是从文件中进行的,并且需要很少的内存。

索引是一个字典树结构,其中可以查找三元组;将输入的每个三元组的输出进行匹配和排序,以获得最相似的字符串。

示例

>>> from ngram_search import Ngrams
>>> ngrams = Ngrams(path)
>>> ngrams.search("ham", 0.24)
[(0, 1.0), (2, 0.25)]
>>> ngrams.search("spa", 0.2)
[(0, 0.375)]

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

ngram-search-0.1.2.tar.gz (53.1 kB 查看哈希值)

上传于

构建的发行版

ngram_search-0.1.2-pp37-pypy37_pp73-win32.whl (24.1 kB 查看哈希)

上传于 PyPy Windows x86

ngram_search-0.1.2-pp37-pypy37_pp73-manylinux2010_x86_64.whl (29.8 kB 查看哈希)

上传于 PyPy manylinux: glibc 2.12+ x86-64

ngram_search-0.1.2-pp37-pypy37_pp73-macosx_10_9_x86_64.whl (22.5 kB 查看哈希)

上传于 PyPy macOS 10.9+ x86-64

ngram_search-0.1.2-pp36-pypy36_pp73-win32.whl (24.1 kB 查看哈希)

上传于 PyPy Windows x86

ngram_search-0.1.2-pp36-pypy36_pp73-manylinux2010_x86_64.whl (29.8 kB 查看哈希)

上传于 PyPy manylinux: glibc 2.12+ x86-64

ngram_search-0.1.2-pp36-pypy36_pp73-macosx_10_9_x86_64.whl (22.5 kB 查看哈希)

上传于 PyPy macOS 10.9+ x86-64

ngram_search-0.1.2-cp39-cp39-win_amd64.whl (31.8 kB 查看哈希)

上传于 CPython 3.9 Windows x86-64

ngram_search-0.1.2-cp39-cp39-win32.whl (28.0 kB 查看哈希)

上传于 CPython 3.9 Windows x86

ngram_search-0.1.2-cp39-cp39-manylinux2010_x86_64.whl (156.4 kB 查看哈希)

上传于 CPython 3.9 manylinux: glibc 2.12+ x86-64

ngram_search-0.1.2-cp39-cp39-manylinux2010_i686.whl (152.6 kB 查看哈希值)

上传于 CPython 3.9 manylinux: glibc 2.12+ i686

ngram_search-0.1.2-cp39-cp39-manylinux1_x86_64.whl (156.4 kB 查看哈希值)

上传于 CPython 3.9

ngram_search-0.1.2-cp39-cp39-manylinux1_i686.whl (152.5 kB 查看哈希值)

上传于 CPython 3.9

ngram_search-0.1.2-cp39-cp39-macosx_10_9_x86_64.whl (29.3 kB 查看哈希值)

上传于 CPython 3.9 macOS 10.9+ x86-64

ngram_search-0.1.2-cp38-cp38-win_amd64.whl (31.9 kB 查看哈希值)

上传于 CPython 3.8 Windows x86-64

ngram_search-0.1.2-cp38-cp38-win32.whl (28.1 kB 查看哈希值)

上传于 CPython 3.8 Windows x86

ngram_search-0.1.2-cp38-cp38-manylinux2010_x86_64.whl (160.4 kB 查看哈希值)

上传于 CPython 3.8 manylinux: glibc 2.12+ x86-64

ngram_search-0.1.2-cp38-cp38-manylinux2010_i686.whl (158.2 kB 查看哈希值)

上传于 CPython 3.8 manylinux: glibc 2.12+ i686

ngram_search-0.1.2-cp38-cp38-manylinux1_x86_64.whl (160.4 kB 查看哈希值)

上传于 CPython 3.8

ngram_search-0.1.2-cp38-cp38-manylinux1_i686.whl (158.2 kB 查看哈希值)

上传于 CPython 3.8

ngram_search-0.1.2-cp38-cp38-macosx_10_9_x86_64.whl (29.3 kB 查看哈希值)

上传于 CPython 3.8 macOS 10.9+ x86-64

ngram_search-0.1.2-cp37-cp37m-win_amd64.whl (31.3 kB 查看哈希值)

上传于 CPython 3.7m Windows x86-64

ngram_search-0.1.2-cp37-cp37m-win32.whl (27.1 kB 查看哈希值)

上传于 CPython 3.7m Windows x86

ngram_search-0.1.2-cp37-cp37m-manylinux2010_x86_64.whl (137.4 kB 查看哈希值)

上传于 CPython 3.7m manylinux: glibc 2.12+ x86-64

ngram_search-0.1.2-cp37-cp37m-manylinux2010_i686.whl (136.6 kB 查看哈希值)

上传于 CPython 3.7m manylinux: glibc 2.12+ i686

ngram_search-0.1.2-cp37-cp37m-manylinux1_x86_64.whl (137.3 kB 查看哈希值)

上传于 CPython 3.7m

ngram_search-0.1.2-cp37-cp37m-manylinux1_i686.whl (136.6 kB 查看哈希值)

上传于 CPython 3.7m

ngram_search-0.1.2-cp37-cp37m-macosx_10_9_x86_64.whl (28.9 kB 查看哈希值)

上传于 CPython 3.7m macOS 10.9+ x86-64

ngram_search-0.1.2-cp36-cp36m-win_amd64.whl (31.3 kB 查看哈希值)

上传于 CPython 3.6m Windows x86-64

ngram_search-0.1.2-cp36-cp36m-win32.whl (27.2 kB 查看哈希值)

上传于 CPython 3.6m Windows x86

ngram_search-0.1.2-cp36-cp36m-manylinux2010_x86_64.whl (137.3 kB 查看哈希值)

上传于 CPython 3.6m manylinux: glibc 2.12+ x86-64

ngram_search-0.1.2-cp36-cp36m-manylinux2010_i686.whl (137.1 kB 查看哈希值)

上传于 CPython 3.6m manylinux: glibc 2.12+ i686

ngram_search-0.1.2-cp36-cp36m-manylinux1_x86_64.whl (137.3 kB 查看哈希值)

上传于 CPython 3.6m

ngram_search-0.1.2-cp36-cp36m-manylinux1_i686.whl (137.1 kB 查看哈希值)

上传于 CPython 3.6m

ngram_search-0.1.2-cp36-cp36m-macosx_10_9_x86_64.whl (29.3 kB 查看哈希值)

上传于 CPython 3.6m macOS 10.9+ x86-64

ngram_search-0.1.2-cp35-cp35m-win_amd64.whl (30.9 kB 查看哈希值)

上传于 CPython 3.5m Windows x86-64

ngram_search-0.1.2-cp35-cp35m-win32.whl (26.7 kB 查看哈希值)

上传于 CPython 3.5m Windows x86

ngram_search-0.1.2-cp35-cp35m-manylinux2010_x86_64.whl (134.9 kB 查看哈希值)

上传于 CPython 3.5m manylinux: glibc 2.12+ x86-64

ngram_search-0.1.2-cp35-cp35m-manylinux2010_i686.whl (134.4 kB 查看哈希值)

上传于 CPython 3.5m manylinux: glibc 2.12+ i686

ngram_search-0.1.2-cp35-cp35m-manylinux1_x86_64.whl (134.9 kB 查看哈希值)

上传于 CPython 3.5m

ngram_search-0.1.2-cp35-cp35m-manylinux1_i686.whl (134.4 kB 查看哈希值)

上传于 CPython 3.5m

ngram_search-0.1.2-cp35-cp35m-macosx_10_9_x86_64.whl (28.7 kB 查看哈希值)

上传时间 CPython 3.5m macOS 10.9+ x86-64

支持者