全自动高通量测序分析的最佳实践管道
项目描述
经过验证的、可扩展的、社区开发的变异调用、RNA测序和小RNA分析。您编写一个高级配置文件,指定输入和分析参数。该输入驱动并行运行,处理分布式执行、幂等处理重启和安全事务步骤。bcbio提供了一个共享的社区资源,处理测序分析的数据处理组件,为研究人员提供更多时间专注于下游生物学。
特性
社区开发:我们欢迎贡献者,目标是克服个人开发者面临的问题,这些开发者正在快速变化的研究领域中工作,负责复杂管道的生物、算法和计算挑战。请参阅我们的用户页面,了解bcbio-nextgen部署的示例,以及开发者文档,了解贡献的建议。
安装: 单个安装脚本 准备所有第三方软件、数据库和系统配置文件。
自动验证:将变异调用与常见参考材料或样本特定SNP芯片进行比较,以确保调用正确性。采用多种对齐、准备和变异调用的方法,可实现算法的无偏比较。
分布式:专注于并行分析和扩展,以处理大型人群研究和全基因组分析。在单核多核计算机上运行,在计算集群中使用IPython并行,或在Amazon云上运行。请参阅并行文档,了解详细信息。
多种分析算法:bcbio-nextgen提供可配置的变异调用、RNA测序和小RNA管道。
快速开始
使用所有工具依赖和数据文件安装 bcbio-nextgen
wget https://raw.github.com/bcbio/bcbio-nextgen/master/scripts/bcbio_nextgen_install.py python bcbio_nextgen_install.py /usr/local/share/bcbio --tooldir=/usr/local \ --genomes GRCh37 --aligners bwa --aligners bowtie2
生成一个可编辑的 系统配置文件,其中包含已安装的软件、数据和系统信息。
自动创建项目中的样本FASTQ和BAM文件的处理描述,以及样本元数据的CSV文件
bcbio_nextgen.py -w template freebayes-variant project1.csv sample1.bam sample2_1.fq sample2_2.fq
在8个本地核心上运行分析
cd project1/work bcbio_nextgen.py ../config/project1.yaml -n 8
文档
查看完整文档和基于分析的更长的文章。我们欢迎使用GitHub进行改进或问题报告,并在biovalidation邮件列表上进行讨论。
贡献者
Miika Ahdesmaki,阿斯利康
Luca Beltrame,意大利米兰IRCCS“Mario Negri”药物研究学院
Christian Brueffer,瑞典隆德大学
Alla Bushoy,阿斯利康
Guillermo Carrasco,斯德哥尔摩科学生活实验室
Nick Carriero,西蒙斯基金会
Brad Chapman,哈佛大学陈曾熙公共卫生学院生物信息学核心
Saket Choudhary,南加州大学
Peter Cock,詹姆斯·哈顿研究所
Matthias De Smet,比利时根特大学医院医学遗传中心
Matt Edwards,麻省理工学院
Mario Giovacchini,斯德哥尔摩科学生活实验室
Karl Gutwin,Biogen
Jeff Hammerbacher,西奈山伊坎医学院
Oliver Hofmann,墨尔本大学癌症研究中心
Rory Kirchner,哈佛大学陈曾熙公共卫生学院生物信息学核心
Tetiana Khotiainsteva,Ardigen
Jakub Nowacki,阿斯利康
John Morrissey,哈佛大学陈曾熙公共卫生学院生物信息学核心
Lorena Pantano,哈佛大学陈曾熙公共卫生学院生物信息学核心
Brent Pedersen,科罗拉多大学丹佛分校
James Porter,芝加哥大学
Valentine Svensson,斯德哥尔摩科学生活实验室
Paul Tang,旧金山加州大学
Stephen Turner,弗吉尼亚大学
Roman Valls,斯德哥尔摩科学生活实验室
Kevin Ying,澳大利亚悉尼加文医学研究所
Vlad Saveliev,圣彼得堡大学算法生物技术中心
许可证
代码在MIT许可证下免费提供。
项目详情
bcbio-nextgen-1.1.5.tar.gz的散列值
算法 | 散列摘要 | |
---|---|---|
SHA256 | d02e1585df87a5fad5f4c6544337e49334c0be84690a5c37947c4dcd22d97f08 |
|
MD5 | 01a9ff270a4e3f50d3906a2064e18d73 |
|
BLAKE2b-256 | 9d7e452e1d1051c19c2414f7583c796dc2b165740cf1750f1b6c89226bb8f4c2 |