跳转到主要内容

在vcf文件中创建所有可能的相和不相的块组合

项目描述

Continous integration

Haploblock-shuffler

在vcf文件中创建所有可能的相和不相的块组合


背景

此工具接受相、非相或部分相的VCF文件,并生成与VCF文件中存在的相一致的相块的所有可能的组合。

详细信息

首先,此工具读取VCF文件中的所有变体,如果它们兼容,则将变体分组在一起。

  1. 如果变体是相的(使用PS标记),则它只与其他具有相同相ID的相变体兼容。
  2. 纯合变体总是与其他变体兼容,因为它们是每个相组的组成部分
  3. 杂合变体只有在它们相同时才兼容,且相ID相匹配。

为了产生所有可能的分组变体的组合,haplotype-suffler使用计数器生成一个二进制模式,该模式确定哪些调用应该被修改。要修改一个变体,我们只需反转GT字段的顺序,使0/1变为1/0,反之亦然。

由于每个变体都有两个等位基因,我们只需要生成一半的可能VCF文件,因为另一半是镜像(例如,01011010)。

用法

haploblock-shuffler test.vcf output

要从输出vcf文件生成共识fasta文件,请对输出vcf文件进行bgzip和索引

cd output
for i in out_*.vcf; do
    bgzip $i
    tabix ${i}.gz
done

然后,使用以下命令生成共识

samtools faidx $REFERENCE $REGION | bcftools consensus -H 1 out_0.vcf.gz > out_0_1.fa
samtools faidx $REFERENCE $REGION | bcftools consensus -H 2 out_0.vcf.gz > out_0_2.fa

限制

本工具将在指定的 output 文件夹中生成 2^(n-1) 个 VCF 文件,其中 n 是输入 VCF 中相位块的数目(见上方)。默认情况下,此限制为 11 个块,这意味着最多只能创建 1024 个文件。可以通过使用 --max-blocks 来增加此限制,但请谨慎使用。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分布

haploblock-shuffler-0.0.6.tar.gz (5.5 kB 查看哈希)

上传时间

构建分布

haploblock_shuffler-0.0.6-py3-none-any.whl (5.7 kB 查看哈希)

上传时间 Python 3

由以下支持