跳转到主要内容

外部索引和搜索的GSA集成

项目描述

简介

collective.gsa软件包将Plone网站与Google搜索设备(GSA)集成。它提供了一个索引处理器以及通过collective.indexing提供的搜索功能。

目前collective.gsa仅与Plone 3.x版本进行测试和运行。要使用Plone 4.x运行collective.gsa,您必须修改搜索模板以符合Plone 4的要求。

安装

将collective.gsa添加到您的buildout.cfg中的eggs和zcml部分

[buildout]

eggs = collective.gsa

[instance]
zcml =
    collective.gsa
    collective.gsa-overrides

运行buildout并重新启动服务器后,您可以通过快速安装程序、ZMI或Plone添加/删除产品来安装它。安装软件包后,GSA设置和GSA维护配置将出现在Plone控制面板中。根据字段的说明进行设置。

全局重新索引

在GSA维护配置中有一个工具可以全局重新索引整个网站。如果网站很大,可能会出现内存相关的问题。因此,重新索引允许您通过批处理对象分块运行。

如果更适合运行更多的小批量,那么在示例文件夹中有global_reindex.py示例脚本,它反复运行批量重新索引。

索引

collective.gsa软件包为IQueueIndexProcessor注册适配器,索引是通过collective.indexing软件包完成的。当对象重新索引时,将调用内容提供适配器以获取数据。

该软件包包含实现IATDocument、IATFile和IATContentType的对象的内容提供程序。
  • 对于文档CT(页面、新闻条目等),主宏(通常是站点无工具栏和标题)。

  • 对于文件CT,发送主要文件字段。

  • 对于其他基于原型的CT,标题和描述。

要为其他类型创建支持,请创建自己的内容提供者,实现接口 IContentProvider,并通过 zcml 进行注册。有关详细信息,请参阅 content_provider 模块和 gsa 的 configure.zcml。

如果您的包有两个站点(例如,一个用于编辑访问的安全站点和一个用于匿名访问的公开站点),则该包支持双重索引。GSA 中的对象标识符是其 URL,这是通过对象的 absolute_url 方法获得的。因此,所有索引都必须从您希望其被索引的 URL 处执行(即,不是从 localhost)。在 GSA 控制面板中,您可以设置匿名站点的双重基本 URL。然后使用双重 URL 加上 absolute_url_path 方法来构造 URL。

在重新索引对象时,feed id 会被添加到持久队列中,并在成功发送到 GSA 后被删除,因此如果 GSA 不可达,feed 将在重新索引另一个对象时发送。

GSA 收到 feed 的事实并不意味着它将被索引(即,URL 不在“匹配 URL”设置中)。如果您的对象没有被索引,请检查 GSA 的“爬取和索引”设置。

搜索

此包替换了搜索模板和 livesearch 脚本,以使用 GSA 作为搜索引擎。这是通过在搜索请求中添加 gsasearch=on 来实现的,以避免使用 GSA 搜索内部搜索(例如,导航、文件夹内容等)。

plone 的高级搜索位于默认的搜索_form 模板中,并且根本不使用 GSA,因为 GSA 不像 zope 的 ZCatalog 那样处理索引。但是,您可以使用 GSA 的高级搜索,其 URL 您可以在本地 GSA 控制面板中设置。

卸载

要删除 collective.gsa,请通过 QuickInstaller 卸载它,并将其从 buildout 中删除。

当前状态

基本实现几乎完成,我们旨在为其编写必要的测试。

致谢

此代码受到 collective.solr 包的启发,并由莱斯特大学慷慨赞助。

变更日志

1.0.9 - 2011-01-25

  • 如果 URL 不在门户中,则不要使用 ?searchterm=。

1.0.8 - 2011-01-21

  • 修复了不进行 gsa 搜索时的关键字错误。

1.0.7 - 2010-11-11

  • 为所有基于 archetypes 的对象使用默认视图。

  • 将客户端前端添加到设置中。

  • 将 ConflictError 绕过添加到所有捕获的异常中。

  • 修复了与 GSA 6.4.0 的登录问题。

  • 当 GSA 接受不了 auth cookie 时,返回公共搜索并显示信息视图小部件给用户。

1.0.6 - 2010-06-21

  • 修复了向结果 URL 添加搜索词时的问题,Plone 预期结果不包含额外的参数 - �硬编码的‘?’,这导致了重复。

  • 将某些信息记录改为调试级别。

1.0.5 - 2009-08-11

  • 添加了过滤不良字符的过滤器 - 修复了 GSA 无法完成索引的问题。

  • 添加了卸载方法。

1.0.4 - 2009-07-13

  • 为覆盖搜索框视图小部件添加了 render 方法 - 修复了与 3.1.2 的兼容性。

  • 从所需包中删除了 mechanize(zope2 有自己的版本)。

1.0.3 - 2009-06-24

  • 包含全局_reindex 脚本来运行重新索引(由 Steven Hayles 提供)。

  • 在 gsa-maintenance 视图中只有“重新开始”按钮重置“已重新索引的对象”数量。

1.0.2 - 2009-06-08

  • 如果为零,则从 LiveSearch 中删除排名。

  • 仅对当前 plone 实例中存在的创建者进行过滤。

  • 在重新索引文件时,每提交一个。

  • 为 GSA 索引器添加了直接选项以跳过持久队列(全局重新索引)。

1.0.1 - 2009-05-29

  • 添加了更好的内存错误处理。

1.0 - 初次发布

  • 初次发布

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分发

collective.gsa-1.0.9.zip (78.1 kB 查看哈希值)

上传时间