给定QC管道的输出目录和阈值配置文件,解析所需的指标,并针对阈值进行评估。
项目描述
qc-metric-aggregator
从基因组数据的QC结果目录中解析出单个指标,并输出包含所需指标和样本总体PASS/FAIL状态的报告。
安装
pip install qc-metric-aggregator
用法
usage: aggregate-qc-metrics [-h]
sample_name metrics_dir output_file threshold_file
positional arguments:
sample_name The sample name or id for which the QC metrics apply
metrics_dir The directory to search for metric files, often a cromwell
run directory
output_file File path to store the finalized mertrics TSV
threshold_file Path to the yml thresholds file to validate against
optional arguments:
-h, --help show this help message and exit
示例调用
aggregate-qc-metrics HG00096 /opt/qc/results/HG00096/WholeGenomeSingleSampleQc /opt/qc/scores/qc_results.tsv thresholds.yml
输出格式
即将推出...
阈值文件
您需要传入一个包含您感兴趣指标通过/失败阈值的YAML文件。文件格式由一系列对象组成,每个对象包含以下键
键 | 值 | 注释 |
---|---|---|
metric_name |
要检查的指标名称 | 这可以是任何支持的指标,并且应该是name 返回的值。 |
operator |
用于将指标值与PASS/FAIL阈值进行比较的操作 | 支持< 、<= 、> 、>= 和= 。如果您指定report ,则指标将在最终输出中报告,但不会影响通过/失败状态。 |
value |
要比较指标值的通过/失败阈值 | 如果为operator 指定了report ,则此字段是可选的。 |
示例可以在此处找到
支持的指标
名称 | 描述 | 来源工具 |
---|---|---|
FREEMIX | Freemix | VerifyBamId2 |
Q20_BASES | 具有Q20或更高质量得分的基础总数 | Picard CollectQualityYieldMetrics |
MEAN_COVERAGE | 单倍体覆盖率 | Picard CollectWgsMetrics |
PCT_10X | 10倍覆盖率百分比 | Picard CollectWgsMetrics |
PCT_20X | 20倍覆盖率百分比 | Picard CollectWgsMetrics |
PCT_30X | 30倍覆盖率百分比 | Picard CollectWgsMetrics |
PCT_CHIMERAS | chimera 百分比(对) | Picard CollectAlignmentSummaryMetrics |
READ1_PF_MISMATCH_RATE | 读取1的基础错配率 | Picard CollectAlignmentSummaryMetrics |
READ2_PF_MISMATCH_RATE | 读取2的基础错配率 | Picard CollectAlignmentSummaryMetrics |
MEDIAN_INSERT_SIZE | 库插入大小中位数 | Picard CollectInsertSizeMetrics |
MEDIAN_ABSOLUTE_DEVIATION | 库插入大小mad | Picard CollectInsertSizeMetrics |
PERCENT_DUPLICATION | 标记为重复的读数百分比 | Picard CollectDuplicateMetrics |
MEAN_TARGET_COVERAGE | 目标区域的平均覆盖率。 | Picard CollectHsMetrics |
PCT_TARGET_BASES_10X | 所有目标基因为10倍或更高覆盖率的分数 | Picard CollectHsMetrics |
PCT_TARGET_BASES_20X | 所有目标基因为20倍或更高覆盖率的分数 | Picard CollectHsMetrics |
PCT_TARGET_BASES_30X | 所有目标基因为30倍或更高覆盖率的分数 | Picard CollectHsMetrics |
添加其他指标
要支持其他指标,您只需继承Metric并在AvailableMetrics中注册即可。
由于许多质量控制指标以TSV格式输出,因此有一个辅助类TSVMetric,您可以在继承Metric
的同时从中继承,这将使这更容易。所有目前支持的指标都使用此辅助类,因此您应该可以参考它们作为示例。
项目详细信息
关闭
qc-metric-aggregator-0.1.5.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 3da22cf29af9edce38902503cad769baf3ff3e2299a945aaa9c97568e214832b |
|
MD5 | 5e2ad23d4b0597f42f19927613ddc79e |
|
BLAKE2b-256 | 4e2d490614c083c511e4da56b12319b0b24ecbf5389da50b46d0305505617ffc |
关闭
qc_metric_aggregator-0.1.5-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | dbd6042e65855e142f6843be59e073e64f062d5ba104b68bb3a51f18b2a11942 |
|
MD5 | 2feb3508ffdfd0851832ab3e4fc0d246 |
|
BLAKE2b-256 | c60778da01baeb377442dc2776cd2985b51268818a0f83a99ab979063286e0a0 |