跳转到主要内容

CLUMPS-PTM:利用3D蛋白质结构进行驱动基因发现(Getz实验室)。

项目描述

CLUMPS-PTM

一个用于识别翻译后修饰(PTM)的3D簇(“簇”)的算法。为临床蛋白质组肿瘤图谱联盟(CPTAC)开发。全项目仓库可以在此处找到。

作者: Shankara Anand

电子邮件: sanand@broadinstitute.org

需要Python 3.6.0或更高版本。

安装

PIP

pip3 install clumps-ptm

Git克隆
git clone git@github.com:getzlab/CLUMPS-PTM.git
cd CLUMPS-PTM
pip3 install -e .

使用

CLUMPS-PTM的分析分为三个一般阶段

  1. 映射:将输入的PTM蛋白质组数据映射到PDB结构数据。

映射依赖于源数据,并根据源数据库映射到UNIPROT和最终PDB结构,涉及程序调用blastp+。可以在此处找到示例笔记本,它逐步演示了映射过程并展示了如何使用clumps-ptm API以编程方式运行这些步骤:此处。对于新的数据集,一旦执行了映射,映射文件就用作clumpsptm命令(如下)中的--maps标志。

  1. CLUMPS:运行算法以识别PTM位点的统计显著聚类。

CLUMPS-PTM是为与差异表达蛋白质组数据一起使用而设计的。由于质谱数据中存在丢失的特性,我们选择使用样本组之间PTM水平的大范围变化来调查修改的“聚集”。因此,输入需要来自Limma-Voom差异表达的输出。

usage: clumpsptm [-h] -i INPUT -m MAPS -w WEIGHT -s PDBSTORE [-o OUTPUT_DIR]
                 [-x XPO] [--threads THREADS] [-v]
                 [-f [FEATURES [FEATURES ...]]] [-g GROUPING] [-q]
                 [--min_sites MIN_SITES] [--subset {positive,negative}]
                 [--protein_id PROTEIN_ID] [--site_id SITE_ID] [--alphafold]
                 [--alphafold_threshold ALPHAFOLD_THRESHOLD]

Run CLUMPS-PTM.

optional arguments:
  -h, --help            show this help message and exit
  -i INPUT, --input INPUT
                        <Required> Input file.
  -m MAPS, --maps MAPS  <Required> Mapping with index as indices that overlap
                        input.
  -w WEIGHT, --weight WEIGHT
                        <Required> Weighting for CLUMPS-PTM (ex. logFC).
  -s PDBSTORE, --pdbstore PDBSTORE
                        <Required> path to PDBStore directory.
  -o OUTPUT_DIR, --output_dir OUTPUT_DIR
                        Output directory.
  -x XPO, --xpo XPO     Soft threshold parameter for truncated Gaussian.
  --threads THREADS     Number of threads for sampling.
  -v, --verbose         Verbosity.
  -f [FEATURES [FEATURES ...]], --features [FEATURES [FEATURES ...]]
                        Assays to subset for.
  -g GROUPING, --grouping GROUPING
                        DE group to use.
  -q, --use_only_significant_sites
                        Only use significant sites for CLUMPS-PTM.
  --min_sites MIN_SITES
                        Minimum number of sites.
  --subset {positive,negative}
                        Subset sites.
  --protein_id PROTEIN_ID
                        Unique protein id in input.
  --site_id SITE_ID     Unique site id in input.
  --alphafold           Run using alphafold structures.
  --alphafold_threshold ALPHAFOLD_THRESHOLD
                        Threshold confidence level for alphafold sites.
  1. 后处理:Pymol中的后处理(FDR校正)和可视化。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分布

clumps-ptm-0.0.6.tar.gz (581.9 kB 查看哈希值)

上传时间

构建分布

clumps_ptm-0.0.6-py3-none-any.whl (25.5 kB 查看哈希值)

上传时间 Python 3

由以下组织支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面