使用核PCA为蛋白质生成密集嵌入
项目描述
此工具通过有理核的核PCA生成非数值实体(如文本或生物序列(例如DNA或蛋白质)的低维、连续、分布式向量表示。
当前实现接受任何可以读取为字符串列表的输入数据集。
安装

RatVec 可以在 Python 3.6+ 上安装,使用以下代码在你的终端中安装
$ pip install ratvec
或者从 GitHub 上的最新代码进行安装
$ pip install git+https://github.com/ratvec/ratvec.git
它可以以开发模式安装
$ git clone https://github.com/ratvec/ratvec.git
$ cd ratvec
$ pip install -e .
-e 动态地将 git 仓库中的代码链接到 Python site-packages,以便您的更改立即反映出来。
如何使用
ratvec 会自动安装一个命令行界面。使用以下命令查看
$ ratvec --help
RatVec 有三个主要命令: generate、train 和 evaluate
Generate。下载并准备 RatVec 论文中展示的 SwissProt 数据集。
$ ratvec generate
Train。在给定数据集上计算 KPCA 嵌入。请运行以下命令查看参数
$ ratvec train --help
Evaluate。评估和优化 KPCA 嵌入。请运行以下命令查看参数
$ ratvec evaluate --help
展示数据集
论文中展示的应用(Boutet 等人使用的 SwissProt 数据集 [1])可以直接从 此处 下载,或运行以下命令
$ ratvec generate
参考文献
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定要选择哪个,请了解有关 安装包 的更多信息。
源分发
ratvec-0.1.2.tar.gz (22.6 kB 查看哈希值)
构建分发
ratvec-0.1.2-py3-none-any.whl (24.0 kB 查看哈希值)
关闭
ratvec-0.1.2.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b6142ad1cccb65540be3e2e1cdfa163ee23bd064d1ccedaaf043312123f65753 |
|
MD5 | a8d757ba08afb5c0c971f34bcbd3e2b1 |
|
BLAKE2b-256 | e45f159e89b8c425adc6c338a058dedfd77fca1a979d8e16ef13436abf7e2145 |
关闭
ratvec-0.1.2-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 7bcba08243c0eb741158a447239ca202a5fd7cf6f5966eb2a149aefa17e31914 |
|
MD5 | 98e2e9656e68167cb07c1a7984669d3e |
|
BLAKE2b-256 | edb219709fed9c8bb3a782bcf7d18dced012f7e9d64fb096b68cecb3365aad85 |