氨基酸序列的物化性质、指数和描述符。
项目描述
peptides.py

氨基酸序列的物化性质、指数和描述符。
🗺️ 概览
peptides.py
是一个纯 Python 包,用于计算蛋白质序列的常见描述符。它最初是 Peptides
的移植版本,该包由 Daniel Osorio 编写,但现在也提供了一些来自 EMBOSS、ExPASy 蛋白质鉴定和分析工具 和 Rcpi 的额外功能。
此库没有外部依赖项,适用于所有现代 Python 版本(3.6+)。
📋 特点
以下是不完全的功能列表
- 肽段统计:氨基酸计数和频率。
- QSAR 描述符:BLOSUM 索引、Cruciani 属性、FASGAI 矢量、Kidera 因子、Atchley 因子、MS-WHIM 评分、PCP 描述符、ProtFP 描述符、Sneath 矢量、ST-尺度、T-尺度、VHSE-尺度、Z-尺度。
- 序列轮廓:疏水性、疏水矩、膜位置。
- 物理化学性质:脂肪族指数、不稳定性指数、理论净电荷、等电点、分子量(支持同位素标记)。
- 生物学性质:结构类别预测。
如果这个库缺少有用的统计或描述符,请随时联系并在此项目的 问题跟踪器 上提交功能请求。
🧊 向量化
蛋白质序列的大多数描述符都是查找表中值的简单平均值,因此可以以向量化方式计算。如果可以导入 numpy
,则将使用相关函数(如 numpy.sum
或 numpy.take
),否则可以使用标准库中的 array.array
提供的回退实现。
🔧 安装
直接从 PyPi 安装 peptides
包,它托管通用 wheel,可以用 pip
安装。
$ pip install peptides
否则,peptides.py
也可作为 Bioconda 包提供。
$ conda install -c bioconda peptides
📖 文档
完整的 API 参考 可在在线文档中找到,或直接使用 pydoc
从命令行访问。
$ pydoc peptides.Peptide
💡 示例
首先从蛋白质序列创建一个 Peptide
对象
>>> import peptides
>>> peptide = peptides.Peptide("MLKKRFLGALAVATLLTLSFGTPVMAQSGSAVFTNEGVTPFAISYPGGGT")
然后使用适当的方法计算您想要的描述符
>>> peptide.aliphatic_index()
89.8...
>>> peptide.boman()
-0.2097...
>>> peptide.charge(pH=7.4)
1.99199...
>>> peptide.isoelectric_point()
10.2436...
返回多个标量值的方法(例如,Peptide.blosum_indices
)将返回一个专用命名元组
>>> peptide.ms_whim_scores()
MSWHIMScores(mswhim1=-0.436399..., mswhim2=0.4916..., mswhim3=-0.49200...)
使用 Peptide.descriptors
方法获取一个包含每个可用描述符的字典。这使得创建包含多个蛋白质序列描述符的 pandas.DataFrame
非常容易
>>> seqs = ["SDKEVDEVDAALSDLEITLE", "ARQQNLFINFCLILIFLLLI", "EGVNDNECEGFFSAR"]
>>> df = pandas.DataFrame([ peptides.Peptide(s).descriptors() for s in seqs ])
>>> df
BLOSUM1 BLOSUM2 BLOSUM3 BLOSUM4 ... Z2 Z3 Z4 Z5
0 0.367000 -0.436000 -0.239 0.014500 ... -0.711000 -0.104500 -1.486500 0.429500
1 -0.697500 -0.372500 -0.493 0.157000 ... -0.307500 -0.627500 -0.450500 0.362000
2 0.479333 -0.001333 0.138 0.228667 ... -0.299333 0.465333 -0.976667 0.023333
[3 rows x 66 columns]
💭 反馈
⚠️ 问题跟踪器
发现了一个错误?有一个增强请求?如果您需要报告或提出问题,请访问 GitHub 问题跟踪器。如果您正在报告错误,请尽可能提供有关问题的信息,并尝试在简单、易于复制的环境中重现相同的错误。
🏗️ 贡献
欢迎贡献力量!有关详细信息,请参阅 CONTRIBUTING.md
。
⚖️ 许可证
本库遵循GNU通用公共许可证v3.0提供。原始的R Peptides
包由Daniel Osorio、Paola Rondón-Villarreal和Rodrigo Torres编写,并遵循GNU通用公共许可证v2.0。EMBOSS应用程序遵循GNU通用公共许可证v1.0。
本项目与原始的Peptides
作者没有任何关联、赞助或任何形式的认可。该项目由Martin Larralde在欧洲分子生物学实验室(EMBL)的Zeller团队的博士项目中开发。
项目详情
下载文件
下载适合您平台的文件。如果您不确定该选择哪个,请了解有关安装包的更多信息。
源分布
构建分布
peptides-0.3.4.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | e4cd95c7aec68a1876d85bd544478d2d0106e1d884b515c861979dbe00e14a39 |
|
MD5 | 0975781e534a3b196feca9fd78861a59 |
|
BLAKE2b-256 | c25a871e514852764db28796d4b83bf327cfeab1211e400b2cdfa57cc5ee63d6 |
peptides-0.3.4-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 69ccca384d3e8df4577a1caf50f7e3687cf5c57a015706af045a1cb43e225edd |
|
MD5 | 688c072b90923493c14990f026a5b659 |
|
BLAKE2b-256 | c4cea4526cf3029462cd79ba87220bbd5ad3aba0927321a4d978a0e30f19032f |