跳转到主要内容

使用核PCA为蛋白质生成密集嵌入

项目描述

此工具通过有理核的核PCA生成非数值实体(如文本或生物序列(例如DNA或蛋白质)的低维、连续、分布式向量表示。

当前实现接受任何可以读取为字符串列表的输入数据集。

安装 RatVec 在 PyPI 上的当前版本 RatVec 支持的 Python 版本 RatVec 采用 Apache 2.0 许可证分发

RatVec 可以在 Python 3.6+ 上安装,使用以下代码在你的终端中安装

$ pip install ratvec

或者从 GitHub 上的最新代码进行安装

$ pip install git+https://github.com/ratvec/ratvec.git

它可以以开发模式安装

$ git clone https://github.com/ratvec/ratvec.git
$ cd ratvec
$ pip install -e .

-e 动态地将 git 仓库中的代码链接到 Python site-packages,以便您的更改立即反映出来。

如何使用

ratvec 会自动安装一个命令行界面。使用以下命令查看

$ ratvec --help

RatVec 有三个主要命令: generatetrainevaluate

  1. Generate。下载并准备 RatVec 论文中展示的 SwissProt 数据集。

$ ratvec generate
  1. Train。在给定数据集上计算 KPCA 嵌入。请运行以下命令查看参数

$ ratvec train --help
  1. Evaluate。评估和优化 KPCA 嵌入。请运行以下命令查看参数

$ ratvec evaluate --help

展示数据集

论文中展示的应用(Boutet 等人使用的 SwissProt 数据集 [1])可以直接从 此处 下载,或运行以下命令

$ ratvec generate

参考文献

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定要选择哪个,请了解有关 安装包 的更多信息。

源分发

ratvec-0.1.2.tar.gz (22.6 kB 查看哈希值)

上传时间

构建分发

ratvec-0.1.2-py3-none-any.whl (24.0 kB 查看哈希值)

上传时间 Python 3

由以下支持