在vcf文件中创建所有可能的相和不相的块组合
项目描述
Haploblock-shuffler
在vcf文件中创建所有可能的相和不相的块组合
背景
此工具接受相、非相或部分相的VCF文件,并生成与VCF文件中存在的相一致的相块的所有可能的组合。
详细信息
首先,此工具读取VCF文件中的所有变体,如果它们兼容,则将变体分组在一起。
- 如果变体是相的(使用
PS
标记),则它只与其他具有相同相ID的相变体兼容。 - 纯合变体总是与其他变体兼容,因为它们是每个相组的组成部分
- 杂合变体只有在它们相同时才兼容,且相ID相匹配。
为了产生所有可能的分组变体的组合,haplotype-suffler使用计数器生成一个二进制模式,该模式确定哪些调用应该被修改。要修改一个变体,我们只需反转GT
字段的顺序,使0/1
变为1/0
,反之亦然。
由于每个变体都有两个等位基因,我们只需要生成一半的可能VCF文件,因为另一半是镜像(例如,0101
和1010
)。
用法
haploblock-shuffler test.vcf output
要从输出vcf文件生成共识fasta文件,请对输出vcf文件进行bgzip和索引
cd output
for i in out_*.vcf; do
bgzip $i
tabix ${i}.gz
done
然后,使用以下命令生成共识
samtools faidx $REFERENCE $REGION | bcftools consensus -H 1 out_0.vcf.gz > out_0_1.fa
samtools faidx $REFERENCE $REGION | bcftools consensus -H 2 out_0.vcf.gz > out_0_2.fa
限制
本工具将在指定的 output
文件夹中生成 2^(n-1)
个 VCF 文件,其中 n
是输入 VCF 中相位块的数目(见上方)。默认情况下,此限制为 11 个块,这意味着最多只能创建 1024 个文件。可以通过使用 --max-blocks
来增加此限制,但请谨慎使用。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。
源分布
haploblock-shuffler-0.0.6.tar.gz (5.5 kB 查看哈希)
构建分布
关闭
haploblock-shuffler-0.0.6.tar.gz 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 39a11aeb522ebbe84f030b82874783f6cd1b355688b2398fc8891431f669a3d1 |
|
MD5 | 79d4ea372511701d3b3ed0d72cb0a9ad |
|
BLAKE2b-256 | 668013bacf469cc94a8496def0a5effee97c8273b5d974af8548a21d77955040 |
关闭
haploblock_shuffler-0.0.6-py3-none-any.whl 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a2bcd48542d093e24a34c05faf6f5709229bca37aa73677a5257698169ae313d |
|
MD5 | 5dbc8447731540745a9e2f747e9a999d |
|
BLAKE2b-256 | 95991c9dff7b6c9394e7dada1341ffd8080dafcfb4897a62e42c574e89e6029b |