跳转到主要内容

给定QC管道的输出目录和阈值配置文件,解析所需的指标,并针对阈值进行评估。

项目描述

qc-metric-aggregator

Build Status

从基因组数据的QC结果目录中解析出单个指标,并输出包含所需指标和样本总体PASS/FAIL状态的报告。

安装


pip install qc-metric-aggregator


用法


usage: aggregate-qc-metrics [-h]
                            sample_name metrics_dir output_file threshold_file

positional arguments:
  sample_name     The sample name or id for which the QC metrics apply
  metrics_dir     The directory to search for metric files, often a cromwell
                  run directory
  output_file     File path to store the finalized mertrics TSV
  threshold_file  Path to the yml thresholds file to validate against

optional arguments:
  -h, --help      show this help message and exit

示例调用

aggregate-qc-metrics HG00096 /opt/qc/results/HG00096/WholeGenomeSingleSampleQc /opt/qc/scores/qc_results.tsv thresholds.yml

输出格式

即将推出...


阈值文件

您需要传入一个包含您感兴趣指标通过/失败阈值的YAML文件。文件格式由一系列对象组成,每个对象包含以下键

注释
metric_name 要检查的指标名称 这可以是任何支持的指标,并且应该是name返回的值。
operator 用于将指标值与PASS/FAIL阈值进行比较的操作 支持<<=>>==。如果您指定report,则指标将在最终输出中报告,但不会影响通过/失败状态。
value 要比较指标值的通过/失败阈值 如果为operator指定了report,则此字段是可选的。

示例可以在此处找到


支持的指标

名称 描述 来源工具
FREEMIX Freemix VerifyBamId2
Q20_BASES 具有Q20或更高质量得分的基础总数 Picard CollectQualityYieldMetrics
MEAN_COVERAGE 单倍体覆盖率 Picard CollectWgsMetrics
PCT_10X 10倍覆盖率百分比 Picard CollectWgsMetrics
PCT_20X 20倍覆盖率百分比 Picard CollectWgsMetrics
PCT_30X 30倍覆盖率百分比 Picard CollectWgsMetrics
PCT_CHIMERAS chimera 百分比(对) Picard CollectAlignmentSummaryMetrics
READ1_PF_MISMATCH_RATE 读取1的基础错配率 Picard CollectAlignmentSummaryMetrics
READ2_PF_MISMATCH_RATE 读取2的基础错配率 Picard CollectAlignmentSummaryMetrics
MEDIAN_INSERT_SIZE 库插入大小中位数 Picard CollectInsertSizeMetrics
MEDIAN_ABSOLUTE_DEVIATION 库插入大小mad Picard CollectInsertSizeMetrics
PERCENT_DUPLICATION 标记为重复的读数百分比 Picard CollectDuplicateMetrics
MEAN_TARGET_COVERAGE 目标区域的平均覆盖率。 Picard CollectHsMetrics
PCT_TARGET_BASES_10X 所有目标基因为10倍或更高覆盖率的分数 Picard CollectHsMetrics
PCT_TARGET_BASES_20X 所有目标基因为20倍或更高覆盖率的分数 Picard CollectHsMetrics
PCT_TARGET_BASES_30X 所有目标基因为30倍或更高覆盖率的分数 Picard CollectHsMetrics

添加其他指标

要支持其他指标,您只需继承Metric并在AvailableMetrics中注册即可。

由于许多质量控制指标以TSV格式输出,因此有一个辅助类TSVMetric,您可以在继承Metric的同时从中继承,这将使这更容易。所有目前支持的指标都使用此辅助类,因此您应该可以参考它们作为示例。

项目详细信息


下载文件

下载您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分发

qc-metric-aggregator-0.1.5.tar.gz (9.7 kB 查看哈希值)

上传于 源代码

构建分发版

qc_metric_aggregator-0.1.5-py3-none-any.whl (17.7 kB 查看哈希值)

上传于 Python 3

由以下支持