跳转到主要内容

基于三元的Addok算法。

项目描述

Addok-trigrams

基于三元的Addok索引模式。

安装

pip install addok-trigrams

配置

在您的本地配置文件中

  • 移除不需要的RESULTS_COLLECTORS_PYPATHS

      from addok.config.default import RESULTS_COLLECTORS_PYPATHS
      RESULTS_COLLECTORS_PYPATHS.remove('addok.helpers.collectors.extend_results_reducing_tokens')
      RESULTS_COLLECTORS_PYPATHS.remove('addok.autocomplete.only_commons_but_geohash_try_autocomplete_collector')
      RESULTS_COLLECTORS_PYPATHS.remove('addok.autocomplete.no_meaningful_but_common_try_autocomplete_collector')
      RESULTS_COLLECTORS_PYPATHS.remove('addok.autocomplete.only_commons_try_autocomplete_collector')
      RESULTS_COLLECTORS_PYPATHS.remove('addok.autocomplete.autocomplete_meaningful_collector')
      RESULTS_COLLECTORS_PYPATHS.remove('addok.fuzzy.fuzzy_collector')
    
  • 移除所有 autocompletefuzzy RESULTS_COLLECTORS_PYPATHS,添加新的

      RESULTS_COLLECTORS_PYPATHS += [
          'addok_trigrams.extend_results_removing_numbers',
          'addok_trigrams.extend_results_removing_one_whole_word',
          'addok_trigrams.extend_results_removing_successive_trigrams',
      ]
    
  • trigramize 添加到 PROCESSORS_PYPATHS

      from addok.config.default import PROCESSORS_PYPATHS
      PROCESSORS_PYPATHS += [
          'addok_trigrams.trigramize',
      ]
    
  • INDEXERS_PYPATHS 中移除成对和自动完成索引器

      from addok.config.default import INDEXERS_PYPATHS
      INDEXERS_PYPATHS.remove('addok.pairs.PairsIndexer')
      INDEXERS_PYPATHS.remove('addok.autocomplete.EdgeNgramIndexer')
    

默认情况下,数字单词不会被转换为三元组。为了防止这种情况,设置 TRIGRAM_SKIP_DIGIT=False

用法

使用 addok batch 就像使用真正的addok导入文档一样,但无需运行 addok ngrams,因为它们已经是索引策略的一部分。

项目详情


下载文件

下载适用于您的平台文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分布

addok-trigrams-1.1.1.tar.gz (3.3 kB 查看哈希)

上传时间:

构建分布

addok_trigrams-1.1.1-py3-none-any.whl (3.4 kB 查看哈希值)

上传时间 Python 3

由以下支持