跳转到主要内容

氨基酸序列的物化性质、指数和描述符。

项目描述

peptides.py Stars

氨基酸序列的物化性质、指数和描述符。

Actions Coverage License PyPI Bioconda Wheel Python Versions Python Implementations Source Mirror GitHub issues Docs Changelog Downloads

🗺️ 概览

peptides.py 是一个纯 Python 包,用于计算蛋白质序列的常见描述符。它最初是 Peptides 的移植版本,该包由 Daniel Osorio 编写,但现在也提供了一些来自 EMBOSSExPASy 蛋白质鉴定和分析工具Rcpi 的额外功能。

此库没有外部依赖项,适用于所有现代 Python 版本(3.6+)。

📋 特点

以下是不完全的功能列表

  • 肽段统计:氨基酸计数和频率。
  • QSAR 描述符:BLOSUM 索引、Cruciani 属性、FASGAI 矢量、Kidera 因子、Atchley 因子、MS-WHIM 评分、PCP 描述符、ProtFP 描述符、Sneath 矢量、ST-尺度、T-尺度、VHSE-尺度、Z-尺度。
  • 序列轮廓:疏水性、疏水矩、膜位置。
  • 物理化学性质:脂肪族指数、不稳定性指数、理论净电荷、等电点、分子量(支持同位素标记)。
  • 生物学性质:结构类别预测。

如果这个库缺少有用的统计或描述符,请随时联系并在此项目的 问题跟踪器 上提交功能请求。

🧊 向量化

蛋白质序列的大多数描述符都是查找表中值的简单平均值,因此可以以向量化方式计算。如果可以导入 numpy,则将使用相关函数(如 numpy.sumnumpy.take),否则可以使用标准库中的 array.array 提供的回退实现。

🔧 安装

直接从 PyPi 安装 peptides 包,它托管通用 wheel,可以用 pip 安装。

$ pip install peptides

否则,peptides.py 也可作为 Bioconda 包提供。

$ conda install -c bioconda peptides

📖 文档

完整的 API 参考 可在在线文档中找到,或直接使用 pydoc 从命令行访问。

$ pydoc peptides.Peptide

💡 示例

首先从蛋白质序列创建一个 Peptide 对象

>>> import peptides
>>> peptide = peptides.Peptide("MLKKRFLGALAVATLLTLSFGTPVMAQSGSAVFTNEGVTPFAISYPGGGT")

然后使用适当的方法计算您想要的描述符

>>> peptide.aliphatic_index()
89.8...
>>> peptide.boman()
-0.2097...
>>> peptide.charge(pH=7.4)
1.99199...
>>> peptide.isoelectric_point()
10.2436...

返回多个标量值的方法(例如,Peptide.blosum_indices)将返回一个专用命名元组

>>> peptide.ms_whim_scores()
MSWHIMScores(mswhim1=-0.436399..., mswhim2=0.4916..., mswhim3=-0.49200...)

使用 Peptide.descriptors 方法获取一个包含每个可用描述符的字典。这使得创建包含多个蛋白质序列描述符的 pandas.DataFrame 非常容易

>>> seqs = ["SDKEVDEVDAALSDLEITLE", "ARQQNLFINFCLILIFLLLI", "EGVNDNECEGFFSAR"]
>>> df = pandas.DataFrame([ peptides.Peptide(s).descriptors() for s in seqs ])
>>> df
    BLOSUM1   BLOSUM2  BLOSUM3   BLOSUM4  ...        Z2        Z3        Z4        Z5
0  0.367000 -0.436000   -0.239  0.014500  ... -0.711000 -0.104500 -1.486500  0.429500
1 -0.697500 -0.372500   -0.493  0.157000  ... -0.307500 -0.627500 -0.450500  0.362000
2  0.479333 -0.001333    0.138  0.228667  ... -0.299333  0.465333 -0.976667  0.023333

[3 rows x 66 columns]

💭 反馈

⚠️ 问题跟踪器

发现了一个错误?有一个增强请求?如果您需要报告或提出问题,请访问 GitHub 问题跟踪器。如果您正在报告错误,请尽可能提供有关问题的信息,并尝试在简单、易于复制的环境中重现相同的错误。

🏗️ 贡献

欢迎贡献力量!有关详细信息,请参阅 CONTRIBUTING.md

⚖️ 许可证

本库遵循GNU通用公共许可证v3.0提供。原始的R Peptides包由Daniel OsorioPaola Rondón-VillarrealRodrigo Torres编写,并遵循GNU通用公共许可证v2.0。EMBOSS应用程序遵循GNU通用公共许可证v1.0

本项目与原始的Peptides作者没有任何关联、赞助或任何形式的认可。该项目由Martin Larralde在欧洲分子生物学实验室(EMBL)的Zeller团队的博士项目中开发。

项目详情


下载文件

下载适合您平台的文件。如果您不确定该选择哪个,请了解有关安装包的更多信息。

源分布

peptides-0.3.4.tar.gz (73.5 kB 查看哈希值)

上传时间

构建分布

peptides-0.3.4-py3-none-any.whl (122.1 kB 查看哈希值)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面