跳转到主要内容

使用Apache Solr索引DBnomics数据以进行全文和分类搜索

项目描述

DBnomics Solr

将DBnomics数据索引到Apache Solr以进行全文和分类搜索。

需求

  • 一个正在运行的Apache Solr实例;在编写本文档时,我们使用的是版本7.3。

请参阅dbnomics-docker以使用Docker运行包含Apache Solr服务的本地DBnomics实例。

配置

环境变量

索引提供者

将以下命令中的wto替换为实际的提供者slug

dbnomics-solr index-provider /path/to/wto-json-data

完整模式与增量模式

当数据存储在常规目录中时,脚本始终索引提供者的所有数据集和系列。这被称为完整模式

当数据存储在Git存储库中时,脚本默认以增量模式运行:它仅索引自上次索引以来已修改的数据集。

可以使用--full选项强制完整模式

裸存储库

该脚本具有一个选项 --bare-repo-fallback,如果找不到,它会尝试在存储目录名末尾添加 .git

从提供者中删除所有数据

删除与提供者相关的所有文档(type:providertype:datasettype:series

dbnomics-solr --debug delete-provider --code <provider_code>
dbnomics-solr --debug delete-provider --slug <provider_slug>

# Examples:
dbnomics-solr --debug delete-provider --code WTO
dbnomics-solr --debug delete-provider --slug wto

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。

源分发

dbnomics_solr-1.1.18.tar.gz (51.2 kB 查看哈希值)

上传时间

构建分发

dbnomics_solr-1.1.18-py3-none-any.whl (45.0 kB 查看哈希值)

上传时间 Python 3

支持者