跳转到主要内容

文档相似度服务器

项目描述

索引纯文本文档并查询索引以查找语义相关的文档。

Simserver使用事务来提供强大且可扩展的相似度服务器。

安装

Simserver基于gensim框架进行主题建模。

安装simserver的简单方法是

sudo easy_install -U simserver

或者,如果您已下载并解压了源tar.gz包,您需要运行

python setup.py test
sudo python setup.py install

此版本已在Python 2.5和2.7下测试,但应能在任何2.5 <= Python < 3.0的版本上运行。

文档

请参阅http://radimrehurek.com/gensim/simserver.html。更多信息即将推出。

许可

Simserver在GNU Affero GPL许可v3下发布。

这意味着您可以在应用程序中免费使用simserver(甚至商业应用程序!),但您必须使用AGPL兼容的许可证将应用程序开源。

AGPL许可证确保即使在您仅将应用程序以远程方式(例如通过网页)提供的情况下,此条款也适用。

TL;DR:simserver是开源的,但任何专有用途都必须与我联系。

历史

0.1.4:
  • 对分片性能的改进

  • 线程模型更改 - 移除了对每个线程会话访问的限制

  • 在index optmize()中的错误修复

0.1.3:
  • 对极少数训练文档的行为进行了更改:使用简单的对数熵模型而不是潜在语义分析

  • 修复了SQLite文件描述符泄露的错误


版权(c)2011 Radim Rehurek

项目详情


下载文件

下载适用于您平台的应用程序文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

simserver-0.1.4.tar.gz (39.0 KB 查看散列)

上传时间

由支持