文档相似度服务器
项目描述
索引纯文本文档并查询索引以查找语义相关的文档。
Simserver使用事务来提供强大且可扩展的相似度服务器。
安装
Simserver基于gensim框架进行主题建模。
安装simserver的简单方法是
sudo easy_install -U simserver
或者,如果您已下载并解压了源tar.gz包,您需要运行
python setup.py test sudo python setup.py install
此版本已在Python 2.5和2.7下测试,但应能在任何2.5 <= Python < 3.0的版本上运行。
文档
请参阅http://radimrehurek.com/gensim/simserver.html。更多信息即将推出。
许可
Simserver在GNU Affero GPL许可v3下发布。
这意味着您可以在应用程序中免费使用simserver(甚至商业应用程序!),但您必须使用AGPL兼容的许可证将应用程序开源。
AGPL许可证确保即使在您仅将应用程序以远程方式(例如通过网页)提供的情况下,此条款也适用。
TL;DR:simserver是开源的,但任何专有用途都必须与我联系。
历史
- 0.1.4:
对分片性能的改进
线程模型更改 - 移除了对每个线程会话访问的限制
在index optmize()中的错误修复
- 0.1.3:
对极少数训练文档的行为进行了更改:使用简单的对数熵模型而不是潜在语义分析
修复了SQLite文件描述符泄露的错误
版权(c)2011 Radim Rehurek
项目详情
关闭
simserver-0.1.4.tar.gz的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | 9fc9b8dd447553d5428d8f1a433057ef76b676da39ae7ec9094422a29814132a |
|
MD5 | 52b1213d5e8bf856a1f42c012a4c50ee |
|
BLAKE2b-256 | bb66f68e2b7f5d2c89ecf034af55f95cbb7b9d508cbbf91144098d01c8fd16aa |