跳转到主要内容

使用RWGK和SVM对蛋白质-蛋白质界面进行评分

项目描述

iScore

图核上的支持向量机用于对蛋白质-蛋白质对接模型进行排名

PyPI DOI RSD Build_Test Coverage Status Codacy Badge Documentation Status

alt text

1. 安装

安装模块的最小信息

  • 检查您的控制台是否可使用mpiexec命令。如果不能,请下载并安装openmpimpich
  • 使用pip install iScore安装iScore

可能出现的问题

  • 如果pip install iScore在安装mpi4py时出现问题,请先使用conda install mpi4py安装mpi4py,然后再使用pip install iScore

2. 文档

该软件包的文档可以在以下位置找到

3. 快速示例

iScore 提供了一种简单的方法,通过图核的支持向量机方法对蛋白质-蛋白质界面进行分类。使用 iScore 最简单的方法是通过专用二进制文件,这些二进制文件隐藏了方法的复杂性,并允许通过简单的命令行界面访问代码。这两个二进制文件是 iscore.trainiscore.predict (对于并行运行,iscore.train.mpiiscore.predict.mpi),分别使用训练集训练模型,并使用此模型对蛋白质-蛋白质复合物的对接模型进行排序。

准备数据的要求

  • 请使用以下文件结构

    root/
    |__train/
    |    |__ pdb/
    |    |__ pssm/
    |    |__ class.lst
    |__test/
          |__pdb/
          |__pssm/
          |__ class.lst (optional)
    

    pdb 文件夹包含对接模型的 PDB 文件,而 pssm 包含 PSSM 文件。 class.lst 是每个对接模型的类别 ID 和 PDB 文件名的列表,例如 0 7CEI_10w

         Check the package subfolders `example/train` and `example/test` to see how to prepare your files.
    
  • PDB 文件和 PSSM 文件必须具有一致的序列。可以使用 PSSMGen 获取一致的 PSSM 和 PDB 文件。它已经与 iScore 一起安装。请查看 README 了解如何使用它。

示例 1. 使用我们的训练模型

您可以直接使用我们的训练模型来评分您的对接构象。我们提供的模型是在对接基准版本 4 (BM4) 数据上训练的,总共使用了 234 个不同的结构(117 个阳性和 117 个阴性)。更多详情请参阅 这篇论文。您可以在包的子文件夹 model/training_set.tar.gz 中找到该模型。

要使用此模型,请进入您的 test 子文件夹,并输入

# Without MPI
iScore.predict

# With MPI
mpiexec -n ${NPROC} iScore.predict.mpi

代码将自动检测模型的路径。

此二进制文件将输出测试集中构象的二进制类别和决策值到一个文本文件 iScorePredict.txt 中。

  For the predicted iScore values, the lower value, the better quality of the conformation.

示例 2. 训练自己的模型

要训练模型,只需进入您的 train 子文件夹,并输入

# Without MPI
iScore.train

# With MPI
mpiexec -n ${NPROC} iScore.train.mpi

此二进制文件将生成一个默认名为 training_set.tar.gz 的存档文件,该文件包含使用训练模型预测测试集二进制类别所需的所有信息。

要使用此模型,请进入您的 test 子文件夹,并输入

# Without MPI
iScore.predict --archive ../train/training_set.tar.gz

# With MPI
mpiexec -n ${NPROC} iScore.predict.mpi --archive ../train/training_set.tar.gz

4. 引用

如果您使用 iScore 软件,请引用以下文章

  1. 耿存亮,金永,尼古拉·雷诺,瓦桑特·霍纳瓦尔,亚历山大·M·J·J·博宁,薛利春。iScore:一种基于图核的新颖蛋白质-蛋白质对接模型评分方法。” 生物信息学,2019,https://doi.org/10.1093/bioinformatics/btz496
  2. 尼古拉·雷诺,金永,瓦桑特·霍纳瓦尔,耿存亮,亚历山大·M·J·J·博宁,薛利春。iScore:基于随机游走图核和支持向量机的蛋白质-蛋白质对接模型排序的 MPI 支持软件。” 软件X,2020,https://doi.org/10.1016/j.softx.2020.100462

项目详情


下载文件

下载适合您平台的项目文件。如果您不确定选择哪个,请了解更多关于 安装软件包 的信息。

源分布

iScore-0.3.5.tar.gz (628.9 kB 查看哈希值)

上传时间

构建分布

iScore-0.3.5-py3-none-any.whl (632.4 kB 查看哈希值)

上传时间 Python 3

支持者