跳转到主要内容

用于比较通路数据库选择在功能富集和分类方法中效果的Python包

项目描述

用于比较功能富集和预测方法任务的通路数据库的Python包。

安装 PyPI上的当前版本 支持的Python版本 Apache-2.0

pathway_forte 可以通过在您的终端中运行以下命令从 PyPI 安装

$ python3 -m pip install pathway_forte

可以通过以下方式从 GitHub 安装最新代码

$ python3 -m pip install git+https://github.com/pathwayforte/pathway-forte.git

对于开发者,可以使用以下方式安装代码

$ git clone https://github.com/pathwayforte/pathway-forte.git
$ cd pathway-forte
$ python3 -m pip install -e .

主要命令

下表列出了PathwayForte的主要命令。

命令

动作

数据集

癌症数据集列表

导出

使用ComPath导出基因集

ora

ORA分析列表

fcs

FCS分析列表

预测

预测方法列表

功能富集方法

  • ora. 列出过度代表性分析(例如,单尾超几何检验)。

  • fcs. 列出使用GSEAPy的功能类评分分析,如GSEA和ssGSEA。

预测方法

pathway_forte通过使用个性化的通路活动评分,实现了三种分类方法(即二分类、为多分类任务训练SVMs或生存分析)。这些评分可以从任何通路使用各种工具(见[1])以及任何允许导出其基因集的通路数据库计算出来。

  • binary. 为二分类任务(例如,肿瘤与正常患者)训练弹性网络模型。训练使用嵌套交叉验证方法(可以在两个循环中选择交叉验证的数量)。由于大多数在scikit-learn(本包使用的机器学习库)中的模型都需要相同输入,因此可以轻松更改使用的模型。

  • subtype. 为多分类任务(例如,预测肿瘤亚型)训练SVM模型。训练使用嵌套交叉验证方法(可以在两个循环中选择交叉验证的数量)。同样,如前面的分类任务,其他模型也可以快速实现。

  • survival. 使用弹性网络惩罚训练Cox比例风险模型。训练使用嵌套交叉验证方法,内循环中使用网格搜索。此分析需要通路活动评分、患者类别和患者生存信息。

其他

  • export. 将当前基因集导出为GMT文件,用于ComPath中包含的通路数据库[2]

  • datasets. 列出可在pathway_forte中运行的TCGA数据集[3]

参考文献

项目详情


下载文件

下载适合您平台的应用程序。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

pathway-forte-0.0.2.tar.gz (1.4 MB 查看哈希值)

上传时间 源代码

支持者