使用RWGK和SVM对蛋白质-蛋白质界面进行评分
项目描述
iScore
图核上的支持向量机用于对蛋白质-蛋白质对接模型进行排名
1. 安装
安装模块的最小信息
可能出现的问题
- 如果
pip install iScore
在安装mpi4py
时出现问题,请先使用conda install mpi4py
安装mpi4py
,然后再使用pip install iScore
。
2. 文档
该软件包的文档可以在以下位置找到
3. 快速示例
iScore 提供了一种简单的方法,通过图核的支持向量机方法对蛋白质-蛋白质界面进行分类。使用 iScore 最简单的方法是通过专用二进制文件,这些二进制文件隐藏了方法的复杂性,并允许通过简单的命令行界面访问代码。这两个二进制文件是 iscore.train
和 iscore.predict
(对于并行运行,iscore.train.mpi
和 iscore.predict.mpi
),分别使用训练集训练模型,并使用此模型对蛋白质-蛋白质复合物的对接模型进行排序。
准备数据的要求
-
请使用以下文件结构
root/ |__train/ | |__ pdb/ | |__ pssm/ | |__ class.lst |__test/ |__pdb/ |__pssm/ |__ class.lst (optional)
pdb
文件夹包含对接模型的 PDB 文件,而pssm
包含 PSSM 文件。class.lst
是每个对接模型的类别 ID 和 PDB 文件名的列表,例如0 7CEI_10w
。Check the package subfolders `example/train` and `example/test` to see how to prepare your files.
-
PDB 文件和 PSSM 文件必须具有一致的序列。可以使用 PSSMGen 获取一致的 PSSM 和 PDB 文件。它已经与 iScore 一起安装。请查看 README 了解如何使用它。
示例 1. 使用我们的训练模型
您可以直接使用我们的训练模型来评分您的对接构象。我们提供的模型是在对接基准版本 4 (BM4) 数据上训练的,总共使用了 234 个不同的结构(117 个阳性和 117 个阴性)。更多详情请参阅 这篇论文。您可以在包的子文件夹 model/training_set.tar.gz
中找到该模型。
要使用此模型,请进入您的 test
子文件夹,并输入
# Without MPI
iScore.predict
# With MPI
mpiexec -n ${NPROC} iScore.predict.mpi
代码将自动检测模型的路径。
此二进制文件将输出测试集中构象的二进制类别和决策值到一个文本文件 iScorePredict.txt
中。
For the predicted iScore values, the lower value, the better quality of the conformation.
示例 2. 训练自己的模型
要训练模型,只需进入您的 train
子文件夹,并输入
# Without MPI
iScore.train
# With MPI
mpiexec -n ${NPROC} iScore.train.mpi
此二进制文件将生成一个默认名为 training_set.tar.gz
的存档文件,该文件包含使用训练模型预测测试集二进制类别所需的所有信息。
要使用此模型,请进入您的 test
子文件夹,并输入
# Without MPI
iScore.predict --archive ../train/training_set.tar.gz
# With MPI
mpiexec -n ${NPROC} iScore.predict.mpi --archive ../train/training_set.tar.gz
4. 引用
如果您使用 iScore 软件,请引用以下文章
- 耿存亮,金永,尼古拉·雷诺,瓦桑特·霍纳瓦尔,亚历山大·M·J·J·博宁,薛利春。 “iScore:一种基于图核的新颖蛋白质-蛋白质对接模型评分方法。” 生物信息学,2019,https://doi.org/10.1093/bioinformatics/btz496。
- 尼古拉·雷诺,金永,瓦桑特·霍纳瓦尔,耿存亮,亚历山大·M·J·J·博宁,薛利春。 “iScore:基于随机游走图核和支持向量机的蛋白质-蛋白质对接模型排序的 MPI 支持软件。” 软件X,2020,https://doi.org/10.1016/j.softx.2020.100462。
项目详情
下载文件
下载适合您平台的项目文件。如果您不确定选择哪个,请了解更多关于 安装软件包 的信息。
源分布
构建分布
iScore-0.3.5.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 1ecb5689061e69771200855a1c3388f759ba27cb55f1c7fe0131bafeb169e805 |
|
MD5 | 258556e20fa8d4933335df82e1965d8b |
|
BLAKE2b-256 | fa5f244f4fc558c898c1e727df1bdba89285eb6c5b1062887b0df63a3ad72a1f |
iScore-0.3.5-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 503f9f9170ca5bacfea0b4470467e47f4b3163cf05c71f08cbe37d0a841b191b |
|
MD5 | 45b623b59b7d91ba9f41136999441494 |
|
BLAKE2b-256 | ef3d86bc66cd8ddc34f95d0296c49991fc97f3214cf4cd0197817a9ecf988341 |