跳转到主要内容

使用zc.buildout配置solr实例

项目描述

配置Solr实例的配方

该配方配置Solr索引服务器的实例。Solr是一个基于Lucene Java搜索库的开源企业级搜索服务器,具有XML/HTTP和JSON API、命中高亮、分面搜索、缓存、复制和Web管理界面

Git仓库和问题跟踪器:https://github.com/collective/collective.recipe.solrinstance

travisci

注意

  • 此配方的版本支持Solr 3.5、4.x(包括4.0、4.1、4.2和4.5)。如果您使用的是Solr 1.4,请使用2.x系列的发布版。

  • 此版本仅支持Genshi模板。如果您需要Cheetah模板并且不需要Python 3支持,请使用5.x之前的发布版。如果您需要Python 3支持,必须将任何自定义模板转换为使用Genshi文本模板语言

支持选项

该配方支持以下选项。

Solr服务器

solr-location

Solr安装位置的路径。这应该是顶级安装目录。

主机

Solr服务器的名称或IP地址,例如:some.server.com。默认为localhost

端口号

服务器端口号。默认为8983

基本路径

服务器上Solr服务的基准路径。最终的Solr服务URL将由以下部分组成

$host:$port/$basepath

附加实际命令。默认为/solr

vardir

可选:覆盖Solr存储索引和日志文件的目录位置。默认为${buildout:directory}/var/solr。此选项和script选项使得在一个buildout中创建多个Solr实例成为可能,并可以将一个或多个实例用于自动功能测试。

logdir

可选:覆盖Solr日志文件的位置。默认为${buildout:directory}/var/solr

pidpath

可选:覆盖Solr pid文件的位置。默认为${buildout:directory}/var/solr

jetty-template

可选:覆盖jetty.xml模板。默认为templates/jetty.xml.tmpl

log4j-template

可选:覆盖log4j.properties模板。默认为templates/log4j.properties.tmpl

logging-template

可选:覆盖logging.properties模板。默认为templates/logging.properties.tmpl

jetty-destination

可选:覆盖生成jetty.xml文件的目录。默认为Solr默认位置。

extralibs

可选:包含自定义Java库。此选项按行接受路径和正则表达式,每行由冒号分隔。正则表达式是可选的,默认为.*\.jar(目录中的所有jar文件)。示例

extralibs =
    /my/global/java/path
    some/special/libs:.*\.jarx
script

可选:覆盖生成的Solr实例控制脚本的名称。默认为solr-instance。此选项和vardir选项使得在一个buildout中创建多个Solr实例成为可能,并可以将一个或多个实例用于自动功能测试。

java_opts

可选。传递给运行Solr的Java虚拟机(JVM)的参数。每个选项都在单独的一行上指定。例如

[solr-instance]
...
java_opts =
  -Xms512M
  -Xmx1024M
...

Solr配置

config-destination

可选:覆盖生成solrconfig.xml文件的目录。默认为Solr默认位置。

config-template

可选:覆盖生成solrconfig.xml文件使用的模板。默认为食谱中包含的模板,即templates/solrconfig.xml.tmpl

max-num-results

Solr服务器返回的最大结果数。此选项设置请求处理器的rows选项。默认为500。

maxWarmingSearchers

可能在后台预热的最多的搜索器数量。默认为4。对于只读从服务器建议设置为12

useColdSearcher

如果请求没有可用的预热搜索器,则立即使用一个预热搜索器来处理请求。默认为false

mergeFactor

指定索引默认合并因子。此值决定了在合并成更大的段之前,存在多少个大小相等的段。默认值 10 时,在合并成一个包含 10000 份文档的段之前,将创建九个包含 1000 份文档的段,一旦达到这个大小,就会合并成一个包含 100000 份文档的段。

ramBufferSizeMB

设置 Lucene 索引在将添加的文档和删除操作刷新到目录之前可能使用的 RAM 量。默认为 16mb。

unlockOnStartup

如果设置为 true(默认值),则在启动时解锁任何持有的写或提交锁。这会取消锁定机制,该机制允许多个进程安全地访问 Lucene 索引。

abortOnConfigurationError

如果设置为 true,则 Solr 实例在存在配置错误时不会启动。这在开发环境中很有用,可以调试与模式和 solrconfig 相关的潜在问题。默认为 false

spellcheckField

配置用于拼写检查搜索组件的字段。默认为 default

autoCommitMaxDocs

允许您启用自动提交处理,并在至少添加指定数量的文档后强制提交。默认情况下是禁用的。

autoCommitMaxTime

允许您在指定的时间(以毫秒为单位)后启用自动提交处理。默认情况下是禁用的。

updateLog

如果启用 updateLog,则会在模式中添加一个额外的字段 _version_,并在 updateHandler 中启用 updateLog。如果您想使用 Solr > 4.0 中的原子更新,则此选项是必需的。请参阅:https://wiki.apache.org/solr/Atomic_Updates,默认为 false

requestParsers-enableRemoteStreaming

允许您启用远程流。默认为 false,因为这是 Solr 的默认值。

requestParsers-multipartUploadLimitInKB

这是一个可选的 <requestParsers /> 参数,如果您向 Solr 提交非常大的文档时非常有用。如果 Solr 从请求中索引二进制文件,则可能是这种情况。

directoryFactory

Solr4 允许使用不同的 directoryFactories:solr.StandardDirectoryFactory,solr.MMapDirectoryFactory,solr.NIOFSDirectoryFactory,solr.SimpleFSDirectoryFactory,solr.RAMDirectoryFactory 或 solr.NRTCachingDirectoryFactory。默认为:solr.NRTCachingDirectoryFactory。如果您正在为应用程序的单元测试运行 solr 实例,则可能有用的是使用 solr.RAMDirectoryFactory。

additional-solrconfig

这是可选的额外配置,可以包含在 solrconfig.xml 内部。例如,<requestHandler /> 指令。

additional-solrconfig-query

这是可选的额外配置,可以包含在 solrconfig.xml 中查询部分内部。例如,<listener /> 指令。

缓存选项

如描述在 http://wiki.apache.org/solr/SolrCaching 中的查询缓存进行精细控制。

支持的选项有

  • filterCacheSize

  • filterCacheInitialSize

  • filterCacheAutowarmCount

  • queryResultCacheSize

  • queryResultCacheInitialSize

  • queryResultCacheAutowarmCount

  • documentCacheSize

  • documentCacheInitialSize

  • documentCacheAutowarmCount(仅适用于 Solr 4)

模式

schema-destination

这是对 schema.xml 文件将生成的目录的可选覆盖。默认为 Solr 的默认位置。

schema-template

这是对生成 schema.xml 文件所使用的模板的可选覆盖。默认为配方中包含的模板,即 templates/schema.xml.tmpl

stopwords-template

用于生成 stopwords.txt 文件的模板的可选覆盖。默认为配方中包含的模板,即 templates/stopwords.txt.tmpl

extra-field-types

配置可用于 index 选项的额外字段类型。您可以使用特殊的分析器和分词器创建自定义字段类型,请参阅 Solr 的完整参考:[http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters](http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters)

extra-conf-files

向 conf 文件夹中添加额外文件,如 synonyms.txt 或 hunspell 文件 [http://wiki.apache.org/solr/Hunspell](http://wiki.apache.org/solr/Hunspell)

filter

配置默认字段类型的分析器的过滤器。这些过滤器接受由给定的 tokenizer 产生的标记,并按顺序处理这些标记以添加、更改或删除标记。在应用所有过滤器后,结果标记流被索引到给定的字段中。

此选项适用于给定字段的默认分析器 - 默认情况下,Solr 认为此选项应用于 queryindex 分析器。如果您想配置单独的分析器,请参阅下面的 filter-queryfilter-index 选项。

每个过滤器都在单独的一行上配置,并且每个过滤器将按照指定的顺序应用于标记(在 Solr 操作期间)。

每一行应像这样

text solr.EdgeNGramFilterFactory minGramSize="2" maxGramSize="15" side="front"

在上面的示例中

  • texttype,是内置的字段类型之一;

  • solr.EdgeNGramFilterFactory 是此过滤器的 class;并且

  • minGramSize="2" maxGramSize="15" side="front" 是过滤器配置的参数。它们应格式化为 XML 属性。

默认情况下,对于默认分析器(既是 query 也是 index

  • text 字段使用

    • solr.ICUFoldingFilterFactory

    • solr.WordDelimiterFilterFactory

    • solr.TrimFilterFactory

    • solr.StopFilterFactory

要抑制默认行为,相应地配置 filter 选项。如果您想没有过滤器,则在您的 Buildout 配置中将 filter 设置为(作为一个空选项)。这在您想要没有默认过滤器并希望完全控制指定每个分析器的过滤器时非常有用。

请参阅 Solr 文档中提供的过滤器:[http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#TokenFilterFactories](http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#TokenFilterFactories)

filter-query

仅针对 query 分析器配置默认字段类型的过滤器。此选项类似于 filter,但仅适用于给定字段的 query 分析器。

配置语法与上面的 filter 选项相同。此处指定的选项将在应用主 filter 选项的任何选项之后添加。

filter-index

仅针对 index 分析器配置默认字段类型的过滤器。此选项类似于 filter,但仅适用于给定字段的 index 分析器。

配置语法与上面的 filter 选项相同。此处指定的选项将在应用主 filter 选项的任何选项之后添加。

char-filter

配置默认字段类型的分析器的字符过滤器(CharFilterFactories)。这些是 Solr 字段或查询(消费和生成字符流)的预处理器,可以在保留字符位置信息的同时添加、更改或删除字符

此选项适用于给定字段的默认分析器 —— 默认情况下,Solr认为这适用于查询和索引分析器。如果您想配置单独的分析器,请参阅下面的char-filter-querychar-filter-index选项。

每个字符过滤器在单独的一行上配置,遵循上面filter选项相同的配置语法。每个字符过滤器将按照指定的顺序应用于标记(在Solr操作期间)。

默认情况下,没有为任何分析器指定字符过滤器。

有关可用的字符过滤器的信息,请参阅Solr的文档:http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#CharFilterFactories

char-filter-query

仅为此字段的查询分析器配置默认字段类型的字符过滤器。此选项类似于char-filter,但仅适用于给定字段类型的查询分析器。

配置语法与上面的filter选项相同。此处指定的选项将添加到任何由主要char filter选项应用而来的选项之后。

char-filter-index

仅为此字段的索引分析器配置默认字段类型的字符过滤器。此选项类似于char-filter,但仅适用于给定字段类型的索引分析器。

配置语法与上面的filter选项相同。此处指定的选项将添加到任何由主要char filter选项应用而来的选项之后。

tokenizer

为默认字段类型的分析器配置分词器。

此选项适用于给定字段的默认分析器 —— 默认情况下,Solr认为这适用于查询和索引分析器。如果您想配置单独的分析器,请参阅下面的tokenizer-querytokenizer-index选项。

每个分词器在单独的一行上配置,遵循上面filter选项相同的配置语法。对于给定的字段类型,每个分析器类型只能指定一个分词器。如果您为相同的字段类型指定了多个分词器,则最后一个指定的分词器将具有优先权。

默认情况下,对于默认分析器(既是 query 也是 index

  • text字段使用solr.ICUTokenizerFactory进行分词。

  • text_ws字段使用solr.WhitespaceTokenizerFactory进行分词。

tokenizer-query

仅为此字段的查询分析器配置默认字段类型的分词器。此选项类似于tokenizer,但仅适用于给定字段类型的查询分析器。

配置语法与上面的filter选项相同。此处指定的选项将覆盖任何由主要tokenizer选项应用而来的选项。例如,如果您在tokenizer选项中指定了text_ws分词器,并且在此处重新指定了另一个text_ws分词器,则此分词器将具有优先权。如果没有覆盖,则其他字段类型将不会受到影响。

tokenizer-index

仅为此字段的索引分析器配置默认字段类型的分词器。此选项类似于tokenizer,但仅适用于给定字段类型的索引分析器。

配置语法与上面的filter选项相同。此处指定的选项将覆盖任何由主要tokenizer选项应用而来的选项。例如,如果您在tokenizer选项中指定了text_ws分词器,并且在此处重新指定了另一个text_ws分词器,则此分词器将具有优先权。如果没有覆盖,则其他字段类型将不会受到影响。

index

配置Solr实例提供的不同类型的索引字段。每个字段在单独的一行上配置。每行包含一个由空格分隔的[key]:[value]对的列表,这些对定义了与索引相关的选项。常见字段选项的详细信息请参阅http://wiki.apache.org/solr/SchemaXml#Common_field_options,并在以下示例中展示。

此处支持特殊的 [key]:[value] 对,用于支持 复制字段;如果您指定 copyfield:dest_field,则会在模式中包含一个 <copyField> 声明,将指定字段复制到 dest_field

unique-key

可选的声明字段对所有文档都是唯一的覆盖。有关更多信息,请参阅 http://wiki.apache.org/solr/SchemaXml。默认为 ‘uid’。

default-search-field

配置默认搜索字段,在未明确指定字段时使用。请参阅 http://wiki.apache.org/solr/SchemaXml

default-operator

查询中使用的默认运算符。有效值是 ANDOR。默认为 OR

additional-schema-config

可选的附加配置,包含在 schema.xml 内。例如,自定义 <copyField /> 指令和任何其他属于模式配置的部分(请参阅 http://wiki.apache.org/solr/SchemaXml)。

additionalFieldConfig

可选的附加配置,放置在 <fields>...</fields> 指令内的 schema.xml 中。使用此选项插入动态字段。例如

additionalFieldConfig =
    <dynamicField name="..." type="string" indexed="true" stored="true" />

默认为 ''(空字符串)。

多核心

以下选项仅在指定 collective.recipe.solrinstance:mc 时适用。如果使用常规配方,则它们是可选的。所有定义在 solr-instance 部分中的选项都将继承到核心中。核心可以覆盖先前定义的选项。

cores

对应于单个 Solr 核配置的 Buildout 配置部分的标识符列表。指定的每个标识符都将根据上述选项进行处理,以为每个核心生成 Solr 配置文件。请参阅 多核心 Solr 中的示例。

指定的每个标识符都将生成一个 Solr instanceDir,并将每个核心的条目放置在 Solr 的 solr.xml 配置中。

default-core-name

可选。此选项控制哪个核心被设置为未指定核心名称的传入请求的默认值。这对应于 http://wiki.apache.org/solr/CoreAdmin#cores 中描述的 defaultCoreName 选项。

Zope集成

section-name

zope.conf 生成的 product-config 部分的名称。默认为 solr

zope-conf

其他配方生成的配置片段的可选覆盖,用于包含在 zope.conf 中。默认为

<product-config ${part:section-name}>
    address ${part:host}:${part:port}
    basepath ${part:basepath}
</product-config>

示例

单个Solr

单个 Solr 配置的简单示例

[buildout]
parts = solr-download
        solr

[solr-download]
recipe = hexagonit.recipe.download
strip-top-level-dir = true
url = http://mirrorservice.nomedia.no/apache.org//lucene/solr/3.5.0/apache-solr-3.5.0.zip

[solr]
recipe = collective.recipe.solrinstance
solr-location = ${solr-download:location}
host = 127.0.0.1
port = 1234
max-num-results = 500
section-name = SOLR
unique-key = uniqueID
index =
    name:uniqueID type:string indexed:true stored:true required:true
    name:Foo type:text copyfield:Baz
    name:Bar type:date indexed:false stored:false required:true multivalued:true omitnorms:true copyfield:Baz
    name:Foo bar type:text
    name:Baz type:text
    name:Everything type:text
filter =
    text solr.LowerCaseFilterFactory
char-filter-index =
    text solr.HTMLStripCharFilterFactory
tokenizer-query =
    text solr.WhitespaceTokenizerFactory
additional-schema-config =
    <copyField source="*" dest="Everything"/>

多核心Solr

为了配置多核心 Solr,必须使用 collective.recipe.solrinstance:mc 配方。多核心 Solr 配置的示例可能如下所示

[buildout]
parts = solr-download
        solr-mc

[solr-download]
recipe = hexagonit.recipe.download
strip-top-level-dir = true
url = http://mirrorservice.nomedia.no/apache.org//lucene/solr/3.5.0/apache-solr-3.5.0.zip

[solr-mc]
recipe = collective.recipe.solrinstance:mc
solr-location = ${solr-download:location}
host = 127.0.0.1
port = 1234
section-name = SOLR
directoryFactory = solr.NRTCachingDirectoryFactory
cores = core1 core2

[core1]
max-num-results = 99
unique-key = uniqueID
index =
    name:uniqueID type:string indexed:true stored:true required:true
    name:Foo type:text copyfield:Baz
    name:Bar type:date indexed:false stored:false required:true multivalued:true omitnorms:true copyfield:Baz
    name:Foo bar type:text
    name:Baz type:text
    name:Everything type:text
filter =
    text solr.LowerCaseFilterFactory
char-filter-index =
    text solr.HTMLStripCharFilterFactory
tokenizer-query =
    text solr.WhitespaceTokenizerFactory
    text solr.LowerCaseFilterFactory
additional-schema-config =
    <copyField source="*" dest="Everything"/>

[core2]
max-num-results = 66
unique-key = uid
index =
    name:uid type:string indexed:true stored:true required:true
    name:La type:text
    name:Le type:date indexed:false stored:false required:true multivalued:true omitnorms:true
    name:Lau type:text
filter =
    text solr.LowerCaseFilterFactory
char-filter-query =
    text solr.HTMLStripCharFilterFactory
tokenizer-index =
    text solr.WhitespaceTokenizerFactory

变更历史

5.3.3 (2016-05-10)

  • 添加 requestParsers-enableRemoteStreaming 以允许配置远程流 [wengole]

  • solrconfig.xml 中更新请求处理程序,以避免 SOLR 4 的弃用警告 [mgrbyte]

  • 修复模式和停用词模板的位置。 [gforcada]

5.3.2 (2014-08-27)

  • 从生成的 solrconfig.xml 文件中删除缺失的库目录。 [davidjb]

  • 添加启用 SOLR 4.0 中原子更新使用的 updateLog 的选项。这将在您的模式中自动添加一个新字段 _version_,请参阅: http://wiki.apache.org/solr/SchemaXml#Fields [saily]

  • 将写入模板文件的字符串编码为 UTF-8。这解决了问题 #29 并允许模板中存在 Unicode 字符。 [davidjb]

  • 从生成的 solrconfig.xml 文件中删除缺失的库目录。 [davidjb]

  • 修复solrconfig.xml以索引二进制文件 [giacomos]

  • 将solr 4模板中的远程流默认值改回false(solr默认值) [wengole]

5.3.1 (2013-12-17)

  • 添加storeOffsetsWithPositions以使PostingsSolrHighlighter正常工作。[jod]

5.3.0 (2013-12-16)

  • 添加小修复到spellchecker中的wrodbreak,增加了spellcheckField。[jod]

  • extra-conf-files添加到模式生成中。现在我们可以向conf文件夹添加额外的文件。[jod]

5.2.1 (2013-10-22)

  • 修复变更日志和PyPI显示的格式 [davidjb]

5.2 (2013-10-22)

  • 确保使用默认模板在solrconfig.xml中只生成一个dataDir选项。修复了Solr 4.5.0的启动问题。[mitchellrj, pmcnr]

5.1 (2013-09-04)

  • 确保更改核心部分的一部分将导致Solr配置被重新生成。修复了#24。[davidjb]

  • logdir选项现在可用于logging.properties模板。[pmcnr]

  • 修复Python 3的测试并启用Travis的Python 3.3测试。[davidjb]

  • 从模板(Solr >= 4.3默认使用log4j作为其SLF4J实现)中启用生成log4j.properties。[pmcnr]

5.0.1 (2013-06-24)

  • 对readme和变更日志进行小的reST更改以修复长描述。[davidjb]

5.0 (2013-06-24)

  • 如果在构建时删除了solr实例目录,则重新创建solr配置。[mghh]

  • 新增选项“additionalFieldConfig”。此选项允许在schema.xml的<fields>…</fields>部分中添加额外的配置选项。如果您有动态字段,请使用此选项。[mghh]

  • 新增选项“directoryFactory”。使用它来定义Solr实例的Solr目录工厂。[mghh]

  • 允许在运行中的Solr实例中断的情况下重新运行Buildout。[Jc2k]

  • 从工件文件名(jar文件)中删除apache-前缀,以处理由Solr 4.1引入的命名更改。版本低于4.1的将看到此前缀包含在配置文件中。[davidjb]

  • 确保Solr 4模板中不包含两个autoCommit指令,类似于Solr 3模板的操作。

    向后不兼容:如果依赖于Solr 4中的默认autoCommit指令,则必须配置autoCommitMaxDocs和/或autoCommitMaxTime配方选项。默认值不再提供。[davidjb]

  • 添加Python 3支持。删除了对Python < 2.6的支持。删除对iw.recipe.template的依赖,因为Cheetah不支持Python 3。用Genshi替换,因为collective.recipe.template使用Genshi。[davidjb]

    向后不兼容:必须将自定义模板转换为Genshi格式。[mitchellrj]

4.0.1 (未发布)

  • 添加了允许扩展solrconfig.xml查询部分的additional-solrconfig-query。[naro]

  • 添加指定pid文件位置的能力。[CheeseTheMonkey]

4.0 (2013-02-15)

  • 添加控制不同分析器(例如queryindex分析器)的filterchar-filtertokenizer选项的能力。这些选项的命名类似于filter-query。[davidjb]

  • 为控制默认字段类型分析器设置的标记化器添加了tokenizer选项。[davidjb]

  • 支持Solr 4.0。[silviot]

  • 允许在索引指令中添加注释。[silviot]

  • 允许通过换行符而不是仅通过空格来分隔cores。[domruf]

  • char-filter作为设置默认字段类型的CharFilterFactories的选项。[davidjb]

3.8 (2012-08-09)

  • 支持使用default-core-name指定未指定核心的传入Solr请求要使用的核心的名称。请参阅http://wiki.apache.org/solr/CoreAdmin#cores [reinhardt]

  • 通过使用 additional-schema-config 选项,向 schema.xml 添加任意配置的能力。[davidjb]

  • 为索引的 copyfield 选项添加文档和测试,以测试并明确此选项可用。[davidjb]

3.7.1 (2012-02-28)

  • 修复了缺少文件的包,如果没有 MANIFEST.in,则需要 setuptools-git。[jod]

3.7 (2012-02-28)

  • 修复了测试。[jod]

  • 添加了 abortOnConfigurationError 选项(使配置错误诊断变得容易得多)。[gweis]

  • 添加了对字段选项 termVectorstermPositionstermOffsets 的支持。[gweis]

  • 使用部分位置查找额外的 jar 包。[gweis]

  • 为多核设置复制 dist 和 contrib 文件夹(就像单核一样)。[gweis]

  • 禁用了 elevate.xml,如果启用此选项,solar 将无法正常工作。[gweis]

3.6 (2011-12-07)

  • 考虑到 Solr 3.4 中与 omitNorms 字段相关的新模式验证。[hannosch]

  • 更新生成的配置文件以匹配并要求 Solr 3.5。[hannosch]

  • 修复 solr-instance purge,使其能够与 localhost:8983 以外的主机/端口一起工作。[csenger]

  • 添加了新的 extralibs 选项,用于包含自定义 Java 库

3.5 (2011-07-10)

  • 为了配置查询缓存的所有方面,移除了 cacheSize 选项,改为使用 8 个特定的选项。[hannosch]

  • 添加了新的 spellcheckField 选项,用于配置拼写检查搜索组件的源字段。[hannosch]

  • 移除了示例 tvrhtermselevate 请求处理器。[hannosch]

  • 移除了示例 spell 请求处理器,并启用了基于 search 请求处理器 default 字段的拼写检查。[hannosch]

  • 清理了 solrconfig 模板并移除了一个示例 firstSearcher 查询。[hannosch]

  • 添加了新的 mergeFactorramBufferSizeMBunlockOnStartup 选项。[hannosch]

3.4 (2011-07-09)

  • 更新生成的配置文件以匹配并要求 Solr 3.3。[hannosch]

  • solr.WordDelimiterFilterFactory 添加到标准文本字段,以在单词内部分隔符(如 -_:)处进行拆分。[hannosch]

3.3 (2011-06-25)

  • requestParsers-multipartUploadLimitInKB 的默认值从 2mb 增加到 100mb,以便 update/extract 处理器能够接受大文件。[hannosch]

  • 将 Jetty 的 maxFormContentSize 从 1mb 增加到 100mb,以便索引大文件。[hannosch]

  • text 类型的字段定义改为避免特定于英语语言的过滤器,而使用基于 ICU 分词器和折叠过滤器的默认过滤器配置,以便适用于大多数语言。[hannosch]

  • 加载 analysis-extras 库,以便我们可以使用基于 ICU 的过滤器和分词器。[hannosch]

  • 由于我们未加载 contrib/clustering 库,因此从默认配置中移除了聚类请求处理器。[hannosch]

  • 启用 Tika 数据提取和 Solr Cell 库。数据提取到名为 tika_content 的字段中,除非在每次请求中通过 fmap.content= 参数指定其他字段。所有不在模式中的提取字段都将放入以 tika_ 为前缀的动态字段中。[tom_gross, hannosch]

  • 移除了由 Velocity 驱动的 /browse 请求处理器。我们生成的示例配置与模式不匹配。[hannosch]

3.2 (2011-06-23)

  • 添加了一个新的选项 stopwords-template,允许您指定自定义停用词文件。[hannosch]

3.1 (2011-06-06)

  • 更新模板以匹配Solr 3.2中的默认设置。[hannosch]

3.0 (2011-06-04)

  • 不再需要elementtree。[hannosch]

  • 使用标准库的doctest模块。[hannosch]

  • max-num-results默认值从10增加到500,以避免在低级别上限制搜索结果。应用层应负责进行此类限制。[hannosch]

3.0a2 (2011-05-26)

  • 添加了新的logging-template选项,并指导Jetty使用logging.properties文件。默认日志级别设置为WARNING。[hannosch]

  • host选项传递给Jetty配置,以便它可以配置为只监听localhost或特定IP。[hannosch]

  • 禁用了Jetty请求日志。[hannosch]

  • 更新了jetty.xml模板,以匹配Solr 3.1发布中找到的新默认设置。[hannosch]

  • 修复了围绕httpCaching指令引入的语法错误。[hannosch]

3.0a1 (2011-05-26)

  • 更新了solrconfig.xml模板,以匹配Solr 3.1的模板。[hannosch]

  • 更新了默认的schema.xml到Solr 3.1格式。版本号现在是1.3而不是1.2。该模式不再与Solr 1.4兼容。请使用2.x系列的配方版本。

    对模式的更改包括

    • 字段不再有压缩选项。

    • 默认模式定义了三种新的字段类型:pointlocationgeohash,用于地理空间数据。

    如果您有一个较旧的Solr 1.4索引,您应该能够继续使用它而无需完全重新索引。[hannosch]

2.1 (2011-04-12)

  • 修复了reStructuredText。[jod]

2.0 (2011-04-12)

  • 添加了过滤器属性的default。[jod]

  • 多核配方collective.recipe.solrinstance:mc。[jod]

    • 重构以使多核工作。[jod]

    • 锁定buildout版本以使测试工作。[jod]

1.1 (2011-04-04)

  • 使jetty.xml.tmpl遵守主机参数。[davidblewett]

  • 支持Windows [bluszcz]

1.0 (2010-12-12)

  • 无更改。

1.0b5 (2010-09-03)

  • 实际上为cacheSize选项提供默认值。[hannosch]

1.0b4 (2010-08-12)

  • 添加了jetty-template选项。[ajung]

1.0b3 (2010-07-23)

  • 当脚本仅用于以守护进程启动solr时,不要在脚本完成后杀死solr [do3cc]

1.0b2 (2010-06-01)

  • 实际上在update调用中做了一些事情。现在,在再次运行buildout时,会更新配置。[fschulze]

  • 在包装脚本中处理终止信号,以便在包装脚本死亡时杀死solr实例。[fschulze]

1.0b1 (2010-05-25)

  • 添加了新的autoCommitMaxDocsautoCommitMaxTime选项。[hannnosch]

  • logdir选项内部错误修复:buildout不允许None选项值(__setitem__)。[anguenot]

1.0a7 (2010-05-17)

  • 修复了新logdir代码中的语法错误。[ajung]

1.0a6 (2010-05-17)

  • 添加了logdir选项。[ajung]

1.0a5 (2010-05-11)

  • 添加了更多选项:maxWarmingSearchersuseColdSearchercacheSize。[hannosch]

1.0a4 (2010-05-05)

  • 添加了JMX配置。有关更多详细信息,请参阅http://wiki.apache.org/solr/SolrJmx。您可以通过将-Dcom.sun.management.jmxremote添加到java_opts选项来启用它。[hannosch]

1.0a3 (2010-03-23)

  • 添加了具有与int类型相同属性的名为integer的字段类型。这确保由collective.solr创建的基本模式不需要任何模式更改,尽管它们仍然需要完全重新索引。[hannosch]

1.0a2 (2010-03-22)

  • 修复了更改日志中的无效reStructuredText格式。[hannosch]

1.0a1 (2010-03-22)

  • 在管理员部分将 gettableFiles 选项替换为新的 *.admin.ShowFileRequestHandler 方法。默认情况下,除了 scripts.conf 以外,你的整个 SOLR_HOME/conf 都被暴露。 [hannosch]

  • 将默认的 schema.xml 更新为 Solr 1.4 格式。模式版本现在是 1.2 而不是 1.1。该模式不再与 Solr 1.3 兼容。请使用 0.x 系列的配方版本。 [hannosch]

    对模式的更改包括

    • 整数字段现在称为 int。 [hannosch]

    • 引入了新的字段类型属性 omitTermFreqAndPositions。默认情况下,除了文本字段外,此属性为真。 [hannosch]

    • 引入了新的二进制和随机字段类型。 [hannosch]

    • int、float、long、double 和 date 字段现在使用 solr.Trie* 类。总的来说,这些类更高效。 [hannosch]

    • 引入了新的 tint、tfloat、tlong、tdouble 和 tdate 字段。这些是配置了 precisionStep 的 solr.Trie* 字段。你可以使用它们来处理许多范围查询的字段。 [hannosch]

    • 旧的 sint、slong、sfloat 和 sdouble 字段不再配置。 [hannosch]

    • 默认情况下不再配置 examples 字段 text_greek、textTight 和 alphaOnlySort。 [hannosch]

    • 文本字段现在使用具有英语语言的 SnowballPorterFilterFactory,而不是 EnglishPorterFilterFactory。 [hannosch]

    • 被忽略的字段现在是多值。 [hannosch]

    • 默认情况下没有配置动态字段。 [hannosch]

    如果你有一个旧的 Solr 1.3 配置,你可能需要调整它以匹配一些新默认值。如果任何字段的类型发生了变化(如 int 或 date 字段),你还需要对 Solr 进行完全重建索引。 [hannosch]

  • 简化了 solrconfig.xml,并取消配置了依赖于特定模式的示例处理器。其他更改包括

    • 当 ramBufferSizeMB 超出时,现在将索引刷新,默认为 32mb 而不是每 1000 个文档。maxBufferedDocs 已弃用。 [hannosch]

    • 新的 reopenReaders 选项会导致 IndexReaders 重新打开,而不是关闭后再打开。 [hannosch]

    • filterCache 使用 solr.FastLRUCache 而不是 solr.LRUCache。 [hannosch]

    • queryResultWindowSize 的默认值现在为 30 而不是 10。 [hannosch]

    • requestHandler 使用新的 solr.SearchHandler,该处理器支持 defType 参数,将其转换为 dismax 处理器,而不是为两个处理器提供两个单独的类。 [hannosch]

    Solr 1.4 中有多个新处理器,默认情况下未启用。请参阅 Solr 文档中的示例。 [hannosch]

  • 更新了 jetty.xml 和 solrconfig.xml 以符合 Solr 1.4 的默认设置。默认情况下,*.jetty.Request.maxFormContentSize 已设置为允许 1mb 的 POST 请求。 [hannosch]

  • 通过在测试构建环境中安装更多包,使测试通过。 [hannosch]

0.4 (2010-02-18)

  • 进行了一些包元数据清理。 [hannosch]

  • 为运行 Solr 的 Java 虚拟机 (JVM) 添加了可选的 java_opts 参数。 [anguenot]

  • 确保在 log 文件夹内创建 solr.log 文件。 [deo]

  • 在引发相关错误时,确保显示无效的索引属性名称。 [deo]

  • 添加了对定义自定义字段类型的支持。 [deo]

  • 向 solr 实例控制脚本中添加了 restart 命令。 [deo]

0.3 (2009-09-10)

  • 添加了 requestParsers-multipartUploadLimitInKB,允许调整请求解析器的限制。 [anguenot]

  • 添加了 additional-solrconfig,允许扩展 solrconfig.xml。 [anguenot]

  • 支持 schema 索引属性值中的空白。 [anguenot]

  • 添加了 default-operator。 [swampmonkey]

  • 添加了 config-template,允许使用不同的模板生成 solrconfig.xml 文件。 [cguardia]

  • 添加了 vardirscript 选项,使得在单个构建中安装多个 Solr 实例成为可能。 [hathawsh]

0.2 (2008-08-08)

  • 通过使用 SIGTERM 而不是 SIGHUP 改进了 stop 命令。 [guido_w]

  • 当作为守护进程运行 solr 实例时,确保将 stdout 和 stderr 重定向到日志文件。 [guido_w]

  • 增加了设置Solr过滤器的支持。[deo]

0.1 (2008-07-07)

  • 第一个公开版本。[dokai]

贡献者

  • Andreas Zeidler

  • Carlos de la Guardia

  • Dorneles Tremea

  • Florian Schulze

  • Guido Wesdorp

  • Hanno Schlichting

  • Jan Murre

  • Joshua LaPlace

  • Julien Anguenot

  • Kai Lautaportti

  • Shane Hathaway

  • Tarek Ziade

  • Tom Gross

  • Andreas Jung

  • David Blewett

  • Josip Delic

  • Carsten Senger

  • Gerhard Weis

  • David Beitey

  • Richard Mitchell

  • Pedro Romano

  • Giacomo Spettoli

  • Daniel Widerin

下载

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

collective.recipe.solrinstance-5.3.3.tar.gz (90.9 kB 查看哈希值)

上传时间

支持