跳转到主要内容

分子信号通路先验知识处理

项目描述

Demo

OmniPath

你对OmniPath数据感兴趣吗?查看我们的R包OmnipathR,它是访问OmniPath最流行和最通用的接口,由150多个原始资源构建的数据库。如果你使用Python并且不需要自己构建数据库,请尝试我们的Python客户端。在这里了解更多关于网络服务的信息。

你需要pypath吗?

Pypath是OmniPath的数据库构建器。对于大多数人来说,OmniPath中分发的数据已经令人满意(见上文),他们实际上不需要pypath。通常你需要pypath来

  • 构建自定义或非常新的OmniPath数据库版本

  • 使用ID转换、同源性转换等工具之一(参见utils模块)。

  • 直接从原始资源获取原始或预处理数据(参见inputs模块)。

安装

从PyPI安装

pip install pypath-omnipath

从Git安装

pip install git+https://github.com/saezlab/pypath.git

文档

阅读参考文档或查看教程。关于pypath最全面的指南是Pypath手册

获取帮助

如果您有任何问题或遇到问题,请通过Github issues页面联系我们。

特性

pypath是一个用于处理分子生物学数据资源的Python模块,它将数据资源组合成数据库,并在Python中提供灵活的接口,同时将数据导出以便通过其他平台(如R网络服务Cytoscape和BEL(生物表达语言))访问。

pypath提供超过100个资源的访问!它构建了5个主要组合数据库,在这些数据库中我们可以区分不同的数据集。5个主要数据库包括:相互作用(分子相互作用网络或通路)、酶-底物关系、蛋白质复合物、分子注释(功能作用、定位等)和细胞间通讯作用。

pypath由多个子模块组成,每个子模块又包含多个子模块。总的来说,pypath大约由100个模块组成。最重要的较高层子模块包括:

  • pypath.core: 包含数据库类,例如网络、复合物、注释等

  • pypath.inputs: 包含特定资源的直接下载和预处理原始数据的方法

  • pypath.omnipath: 高级应用,例如数据库管理器、网络服务器

  • pypath.utils: 独立的有用工具,例如标识符转换器、基因本体处理器、BioPax处理器等

集成数据库

最初,pypath的主要目标是使用igraph对象作为集成数据结构的基础,从多个来源构建网络。从版本0.7和0.8开始,这种设计原则开始改变。如今,pypath构建了多个不同的数据库,通过丰富的API公开它们,并且每个数据库都可以转换为pandas.DataFrame。负责集成数据库的模块和类位于pypath.core中。五个主要数据库如下:

  • 网络 - core.network

  • 酶-底物 - core.enz_sub

  • 复合物 - core.complex

  • 注释 - core.annot

  • 细胞间 - core.intercell

一些数据库有不同变体(例如PPI和转录网络),并且都可以通过许多参数进行自定义。

数据库管理

上述数据库可以通过调用相应的类来加载。然而,构建数据库需要时间和内存,所以我们希望避免在不必要的情况下构建数据库,或者同时在内存中保留多个副本。上述列出的某些模块具有一个名为 get_db 的方法,该方法确保只加载一个数据库实例。但 pypath 中有一个更全面的数据库管理系统可用,这是 pypath.omnipath 模块。此模块能够构建数据库,自动将其保存到 pickle 文件中,并在后续会话中从那里加载。 pypath 包含多个数据库定义,用户可以添加更多。默认情况下,pickle 文件位于 ~/.pypath/pickles/ 目录中。使用 omnipath 模块,获取数据库实例非常简单。例如,要获取 omnipath PPI 网络数据集

from pypath import omnipath
op = omnipath.db.get_db('omnipath')

重要:第一次构建数据库需要从原始资源下载几个 MB 或 GB 的数据。这通常需要很长时间,并且容易出现错误(例如,由于中断的 HTTP 连接而导致截断或空下载)。在这种情况下,您应检查日志以找到问题缓存文件的路径,检查该文件的内容以找出原因,并可能删除该文件以确保在再次调用数据库构建时进行另一次下载尝试。有时原始资源会更改其内容或离线。如果您遇到这种情况,请在 https://github.com/saezlab/pypath/issues 上打开一个问题,以便我们可以在 pypath 中修复它。一旦所有必要的所有内容都已下载并存储在缓存中,数据库构建将更快,但仍可能需要几分钟。

pypath 中的其他模块

除了数据库之外,pypath 还有许多具有独立功能的子模块,可以在其他模块和脚本中使用。以下我们介绍其中的一些。

ID 转换

ID 转换模块 utils.mapping 在各种基因、蛋白质、miRNA 和小分子 ID 类型之间进行转换。它具有将二级 UniProt AC 转换为主 AC、将 Trembl AC 转换为 SwissProt 的功能,使用主基因符号来查找连接。此模块自动加载和存储必要的转换表。许多表是预先定义的,例如 UniProt 映射服务 中的所有 ID,而用户可以使用模块 input_formats 中提供的类从 文件 加载任何表。如何转换标识符的示例

from pypath.utils import mapping
mapping.map_name('P00533', 'uniprot', 'genesymbol')
# {'EGFR'}

同源性翻译

pypath.utils.homology 模块能够找到两个生物体之间基因的直系同源物。它使用来自 NCBI HomoloGene、Ensembl 和 UniProt 的数据。此模块使用非常简单

from pypath.utils import homology
homology.translate('P00533', 10090) # translating the human EGFR to mouse
# ['Q01279'] # it returns the mouse Egfr UniProt AC

它能够处理 pypath.utils.mapping 支持的任何 ID 类型。或者,您还可以访问完整的直系同源基因字典,或者翻译 pandas 数据框中的列。

常见问题解答

它在我的旧 Python 上运行吗?

很可能不行。目前支持的最老版本是 3.9,它在我们的 pyproject.toml 中定义。

R 中有类似的东西吗?

除了从 OmniPath 访问数据之外,OmniPath 的 R 客户端 还提供了与 pypath 类似的许多服务:ID 转换同源性翻译分类学支持GO 支持 以及更多。

关于OmniPath的疑问

联系方式

我们更愿意在GitHub问题中保持所有沟通。关于私人或敏感事项,请随时通过omnipathdb@gmail.com联系我们。

免责声明

由Dénes Türei在Saez实验室协调开发,并由其他小组的开发者和科学家做出贡献,共同开发了

pypath

  • Erva Ulusoy、Melih Darcan、Ömer Kaan Vural、Tennur Kılıç、Elif Çevrim、Bünyamin Şen、Atabey Ünlü和Mert Ergün在HU生物数据科学实验室(PI: Tunca Doğan)

    pypath

    创建了多个新输入模块;

  • Leila Gul、Dezső Módos、Márton Ölbei和Tamás Korcsmáros在Korcsmaros实验室对OmniPath的整体设计、细胞间通信数据库的设计和实施以及各种案例研究和教程做出了贡献;

  • Michael Klein在Fabian Theis小组开发了OmniPath web服务的Python客户端

  • Charles Tapley Hoyt和Daniel Domingo-Fernández增加了BEL导出模块。

  • 来自Saez实验室的Olga Ivanova在

    pypath

    中引入了资源管理器,Sophia Müller-Dott增加了CollecTRI基因调控网络,而Nicolàs Palacio、Sebastian Lobentanzer和Ahmet Rifaioglu进行了各种维护和重构工作。Aurelien Dugourd和Christina Schmidt帮助设计了与代谢组学相关的数据集和服务。

  • R包Cytoscape应用由Francesco Ceccarelli、Attila Gábor、Alberto Valdeolivas、Dénes Türei和Nicolàs Palacio开发和维护;

  • OmniPath的第一款标志由Jakob Wirbel(Saez实验室)设计,当前标志由Dénes Türei设计,而《Nature Methods》的封面图形是EMBL-EBI的Spencer Phillips的作品。

历史和版本

请在此查看pypath的开发历史概览。有关最新发展的更多详细信息,请参阅GitHub版本

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

构建分布

pypath_omnipath-0.16.17-py3-none-any.whl (1.1 MB 查看哈希值)

上传时间 Python 3

支持