跳转到主要内容

高维神经数据聚类

项目描述

https://travis-ci.org/kwikteam/klustakwik2.svg?branch=master

注意:请遵循klusta包的说明 https://github.com/kwikteam/klusta:以下说明不应使用。

安装说明

使用Anaconda发行版安装Python。您需要安装numpy、scipy、cython和nose这些包。对于Windows系统,Python 2.7可能比3.x版本更合适。

在所有平台上,可以使用以下命令安装KlustaKwik:pip install klustakwik2(从源安装)或conda install -c kwikteam klustakwik2(预编译的二进制文件)。默认的安装选项如下:

  • Linux:默认启用多线程。

  • Windows:如果安装了MSVC,则默认启用多线程,否则关闭。注意,在Anaconda发行版下,默认关闭多线程,但如果您安装了MSVC,可以轻松解决这个问题,请参见下文。

  • Mac:默认关闭多线程。

要覆盖这些选项,请从源安装(见下文)。

Windows上的Anaconda多线程

Anaconda发行版安装了自己的编译器,该编译器不支持OpenMP进行多线程,并默认使用该编译器而不是支持OpenMP的MSVC编译器。要禁用Anaconda编译器,只需在安装KlustaKwik之前运行以下命令。

conda remove libpython

从源安装

下载源代码,可以从PyPI上的源分布之一下载,或者从GitHub获取最新版本这里。在此目录中的命令提示符下运行以下命令之一。对于默认选项:

python setup.py install

强制开启多线程

python setup.py install –with-openmp

强制关闭多线程

python setup.py install –no-openmp

Windows

在Anaconda包中安装预编译的Windows二进制文件

conda install -c kwikteam klustakwik2

如果您希望从源代码编译,说明会更加复杂。

使用Python 2.7,您需要一个Python的MS Visual Studio Express 2008版本,免费下载地址这里。Python 3.x可能需要不同的Visual Studio版本,我们尚未测试过。

下载源代码如上所述。在下载并解压缩文件的目录中打开命令提示符。如果您为所有用户安装了Python,则在此命令提示符中需要管理员权限。在Windows中,按Windows键,输入“cmd”,右键单击“cmd.exe”,然后点击“以管理员身份运行”。

现在运行上面的安装源代码部分的命令。

Mac

可以安装一个支持多线程的gcc版本。待办事项:详细信息。

用法

要聚类一对文件name.fet.nname.fmask.n,运行以下命令

kk2_legacy name n

这将生成一个name.klg.nname.clu.n文件。请注意,第一次运行时,会生成大量警告和编译器输出:忽略这些,这是正常的。

您可以为此脚本指定其他选项。以下是主要选项的解释:

  • max_iterations=1000:在放弃之前执行的最大完整迭代次数。

  • max_possible_clusters=1000:最后输出的最大聚类数。目前,此选项限制RAM使用,但在未来的版本中将不再有限制。

  • drop_last_n_features=0:不要使用fet文件中的最后N个特征进行聚类。

  • save_clu_every=None:保存临时.clu文件的频率(以分钟为单位)。

  • num_starting_clusters=500:要使用的初始聚类数(可能应该比您期望找到的最终聚类数多)。

  • start_from_clu=None:如果指定,则从先前保存的 .clu 文件开始聚类。

  • use_mua_cluster=True:是否使用算法的“黑洞” MUA 聚类变体。这旨在提高噪声数据集上的聚类性能,但如果您在使用过程中遇到问题,可以将其关闭。注意,如果开启此选项,聚类 2 将为 MUA 聚类,而第一个“正常”聚类将变为聚类 3。

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码发行版

本发行版没有可用的源代码发行版文件。请参阅有关 生成发行版存档 的教程。

构建的发行版

klustakwik2-0.2.7-cp37-cp37m-manylinux1_x86_64.whl (3.0 MB 查看哈希值)

上传时间 CPython 3.7m

klustakwik2-0.2.7-cp36-cp36m-manylinux1_x86_64.whl (3.0 MB 查看哈希值)

上传时间 CPython 3.6m

klustakwik2-0.2.7-cp27-cp27m-manylinux1_x86_64.whl (2.9 MB 查看哈希值)

上传时间 CPython 2.7m

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面