外部索引和搜索的GSA集成
项目描述
简介
collective.gsa软件包将Plone网站与Google搜索设备(GSA)集成。它提供了一个索引处理器以及通过collective.indexing提供的搜索功能。
目前collective.gsa仅与Plone 3.x版本进行测试和运行。要使用Plone 4.x运行collective.gsa,您必须修改搜索模板以符合Plone 4的要求。
安装
将collective.gsa添加到您的buildout.cfg中的eggs和zcml部分
[buildout] eggs = collective.gsa [instance] zcml = collective.gsa collective.gsa-overrides
运行buildout并重新启动服务器后,您可以通过快速安装程序、ZMI或Plone添加/删除产品来安装它。安装软件包后,GSA设置和GSA维护配置将出现在Plone控制面板中。根据字段的说明进行设置。
全局重新索引
在GSA维护配置中有一个工具可以全局重新索引整个网站。如果网站很大,可能会出现内存相关的问题。因此,重新索引允许您通过批处理对象分块运行。
如果更适合运行更多的小批量,那么在示例文件夹中有global_reindex.py示例脚本,它反复运行批量重新索引。
索引
collective.gsa软件包为IQueueIndexProcessor注册适配器,索引是通过collective.indexing软件包完成的。当对象重新索引时,将调用内容提供适配器以获取数据。
- 该软件包包含实现IATDocument、IATFile和IATContentType的对象的内容提供程序。
对于文档CT(页面、新闻条目等),主宏(通常是站点无工具栏和标题)。
对于文件CT,发送主要文件字段。
对于其他基于原型的CT,标题和描述。
要为其他类型创建支持,请创建自己的内容提供者,实现接口 IContentProvider,并通过 zcml 进行注册。有关详细信息,请参阅 content_provider 模块和 gsa 的 configure.zcml。
如果您的包有两个站点(例如,一个用于编辑访问的安全站点和一个用于匿名访问的公开站点),则该包支持双重索引。GSA 中的对象标识符是其 URL,这是通过对象的 absolute_url 方法获得的。因此,所有索引都必须从您希望其被索引的 URL 处执行(即,不是从 localhost)。在 GSA 控制面板中,您可以设置匿名站点的双重基本 URL。然后使用双重 URL 加上 absolute_url_path 方法来构造 URL。
在重新索引对象时,feed id 会被添加到持久队列中,并在成功发送到 GSA 后被删除,因此如果 GSA 不可达,feed 将在重新索引另一个对象时发送。
GSA 收到 feed 的事实并不意味着它将被索引(即,URL 不在“匹配 URL”设置中)。如果您的对象没有被索引,请检查 GSA 的“爬取和索引”设置。
搜索
此包替换了搜索模板和 livesearch 脚本,以使用 GSA 作为搜索引擎。这是通过在搜索请求中添加 gsasearch=on 来实现的,以避免使用 GSA 搜索内部搜索(例如,导航、文件夹内容等)。
plone 的高级搜索位于默认的搜索_form 模板中,并且根本不使用 GSA,因为 GSA 不像 zope 的 ZCatalog 那样处理索引。但是,您可以使用 GSA 的高级搜索,其 URL 您可以在本地 GSA 控制面板中设置。
卸载
要删除 collective.gsa,请通过 QuickInstaller 卸载它,并将其从 buildout 中删除。
当前状态
基本实现几乎完成,我们旨在为其编写必要的测试。
致谢
此代码受到 collective.solr 包的启发,并由莱斯特大学慷慨赞助。
变更日志
1.0.9 - 2011-01-25
如果 URL 不在门户中,则不要使用 ?searchterm=。
1.0.8 - 2011-01-21
修复了不进行 gsa 搜索时的关键字错误。
1.0.7 - 2010-11-11
为所有基于 archetypes 的对象使用默认视图。
将客户端前端添加到设置中。
将 ConflictError 绕过添加到所有捕获的异常中。
修复了与 GSA 6.4.0 的登录问题。
当 GSA 接受不了 auth cookie 时,返回公共搜索并显示信息视图小部件给用户。
1.0.6 - 2010-06-21
修复了向结果 URL 添加搜索词时的问题,Plone 预期结果不包含额外的参数 - �硬编码的‘?’,这导致了重复。
将某些信息记录改为调试级别。
1.0.5 - 2009-08-11
添加了过滤不良字符的过滤器 - 修复了 GSA 无法完成索引的问题。
添加了卸载方法。
1.0.4 - 2009-07-13
为覆盖搜索框视图小部件添加了 render 方法 - 修复了与 3.1.2 的兼容性。
从所需包中删除了 mechanize(zope2 有自己的版本)。
1.0.3 - 2009-06-24
包含全局_reindex 脚本来运行重新索引(由 Steven Hayles 提供)。
在 gsa-maintenance 视图中只有“重新开始”按钮重置“已重新索引的对象”数量。
1.0.2 - 2009-06-08
如果为零,则从 LiveSearch 中删除排名。
仅对当前 plone 实例中存在的创建者进行过滤。
在重新索引文件时,每提交一个。
为 GSA 索引器添加了直接选项以跳过持久队列(全局重新索引)。
1.0.1 - 2009-05-29
添加了更好的内存错误处理。
1.0 - 初次发布
初次发布
项目详情
collective.gsa-1.0.9.zip的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 8dda3f5711c88e67b87cba80b20e361454848adf665aa5c7c56eee878a839323 |
|
MD5 | 056e9325ee09bd7db6bf3398481aebe9 |
|
BLAKE2b-256 | 338bca56d92191b64caee5b0ad49a8314452b15f6ad30a932a79490ee7af736f |