基于三元的Addok算法。
项目描述
Addok-trigrams
基于三元的Addok索引模式。
安装
pip install addok-trigrams
配置
在您的本地配置文件中
-
移除不需要的RESULTS_COLLECTORS_PYPATHS
from addok.config.default import RESULTS_COLLECTORS_PYPATHS RESULTS_COLLECTORS_PYPATHS.remove('addok.helpers.collectors.extend_results_reducing_tokens') RESULTS_COLLECTORS_PYPATHS.remove('addok.autocomplete.only_commons_but_geohash_try_autocomplete_collector') RESULTS_COLLECTORS_PYPATHS.remove('addok.autocomplete.no_meaningful_but_common_try_autocomplete_collector') RESULTS_COLLECTORS_PYPATHS.remove('addok.autocomplete.only_commons_try_autocomplete_collector') RESULTS_COLLECTORS_PYPATHS.remove('addok.autocomplete.autocomplete_meaningful_collector') RESULTS_COLLECTORS_PYPATHS.remove('addok.fuzzy.fuzzy_collector')
-
移除所有
autocomplete
和fuzzy
RESULTS_COLLECTORS_PYPATHS,添加新的RESULTS_COLLECTORS_PYPATHS += [ 'addok_trigrams.extend_results_removing_numbers', 'addok_trigrams.extend_results_removing_one_whole_word', 'addok_trigrams.extend_results_removing_successive_trigrams', ]
-
将
trigramize
添加到 PROCESSORS_PYPATHSfrom addok.config.default import PROCESSORS_PYPATHS PROCESSORS_PYPATHS += [ 'addok_trigrams.trigramize', ]
-
从
INDEXERS_PYPATHS
中移除成对和自动完成索引器from addok.config.default import INDEXERS_PYPATHS INDEXERS_PYPATHS.remove('addok.pairs.PairsIndexer') INDEXERS_PYPATHS.remove('addok.autocomplete.EdgeNgramIndexer')
默认情况下,数字单词不会被转换为三元组。为了防止这种情况,设置 TRIGRAM_SKIP_DIGIT=False
。
用法
使用 addok batch
就像使用真正的addok导入文档一样,但无需运行 addok ngrams
,因为它们已经是索引策略的一部分。
项目详情
关闭
addok-trigrams-1.1.1.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 7a7a0f3055f83e2c27b2fb5df2292317f707326b56bb1020e420e63dd1875ef0 |
|
MD5 | 74476eae2b61dd7434d03a1fc74cef23 |
|
BLAKE2b-256 | d275e118256b0042a35914f3063ac4efe0237d525e6a0a5c138ec4f6b18679cb |
关闭
addok_trigrams-1.1.1-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | af2bb4b87cd116ab92da2b2e658cddcb894d438e83c58b0482c9fd92ba4752dd |
|
MD5 | bfa60fc5b1c923323679ac332828756e |
|
BLAKE2b-256 | effa883eb846c6c26bcaeae3256e9c7e326d1765c1011c04d84f5d29f9aae23e |