跳转到主要内容

全自动高通量测序分析的最佳实践管道

项目描述

bcbio banner

经过验证的、可扩展的、社区开发的变异调用、RNA测序和小RNA分析。您编写一个高级配置文件,指定输入和分析参数。该输入驱动并行运行,处理分布式执行、幂等处理重启和安全事务步骤。bcbio提供了一个共享的社区资源,处理测序分析的数据处理组件,为研究人员提供更多时间专注于下游生物学。

https://travis-ci.org/bcbio/bcbio-nextgen.png

特性

  • 社区开发:我们欢迎贡献者,目标是克服个人开发者面临的问题,这些开发者正在快速变化的研究领域中工作,负责复杂管道的生物、算法和计算挑战。请参阅我们的用户页面,了解bcbio-nextgen部署的示例,以及开发者文档,了解贡献的建议。

  • 安装: 单个安装脚本 准备所有第三方软件、数据库和系统配置文件。

  • 自动验证:将变异调用与常见参考材料或样本特定SNP芯片进行比较,以确保调用正确性。采用多种对齐、准备和变异调用的方法,可实现算法的无偏比较。

  • 分布式:专注于并行分析和扩展,以处理大型人群研究和全基因组分析。在单核多核计算机上运行,在计算集群中使用IPython并行,或在Amazon云上运行。请参阅并行文档,了解详细信息。

  • 多种分析算法:bcbio-nextgen提供可配置的变异调用、RNA测序和小RNA管道

快速开始

  1. 使用所有工具依赖和数据文件安装 bcbio-nextgen

    wget https://raw.github.com/bcbio/bcbio-nextgen/master/scripts/bcbio_nextgen_install.py
    python bcbio_nextgen_install.py /usr/local/share/bcbio --tooldir=/usr/local \
      --genomes GRCh37 --aligners bwa --aligners bowtie2

    生成一个可编辑的 系统配置文件,其中包含已安装的软件、数据和系统信息。

  2. 自动创建项目中的样本FASTQ和BAM文件的处理描述,以及样本元数据的CSV文件

    bcbio_nextgen.py -w template freebayes-variant project1.csv sample1.bam sample2_1.fq sample2_2.fq

    这会产生一个包含配置选项样本描述文件

  3. 在8个本地核心上运行分析

    cd project1/work
    bcbio_nextgen.py ../config/project1.yaml -n 8

文档

查看完整文档基于分析的更长的文章。我们欢迎使用GitHub进行改进或问题报告,并在biovalidation邮件列表上进行讨论。

贡献者

许可证

代码在MIT许可证下免费提供。

项目详情


下载文件

下载适合您平台的文件。如果您不确定该选择哪个,请了解更多关于安装包的信息。

源代码分发

bcbio-nextgen-1.1.5.tar.gz (2.4 MB 查看散列值)

上传时间 源代码

由以下支持