跳转到主要内容

将gVCF转换为BED

项目描述

这是一个将gVCF文件转换为BED的小工具。这对于提取通过一定基因型质量阈值的区域非常有用。

安装

现在可以通过以下方式通过pypi获取gvcf2bed:pip install gvcf2bed

需求

  • Python 3.4+

  • pyvcf

  • cyvcf2

开发者

  • pytest

  • pytest-cov

变更日志

0.3.1

  • 修复了GQ未定义的变异的bug。

0.3

  • 默认使用cyvcf2,这可以将速度提高约8-10倍。现有的API没有更改,仍然可以使用pyvcf

  • 添加了针对非变异的单独过滤器,因为GQ分数在非变异记录和变异记录上的分布可能不同。

用法

usage: gvcf2bed [-h] -I INPUT -O OUTPUT [-s SAMPLE] [-q QUALITY]
                [-nq NON_VARIANT_QUALITY] [-b]

Create a BED file from a gVCF. Regions are based on a minimum genotype
quality. The gVCF file must contain a GQ field in its FORMAT fields. GQ scores
of non-variants records have a different distribution from the GQ score
distribution of variant records. Hence, an option is provided to set a
different threshold for non-variant positions.

optional arguments:
  -h, --help            show this help message and exit
  -I INPUT, --input INPUT
                        Input gVCF
  -O OUTPUT, --output OUTPUT
                        Output bed file
  -s SAMPLE, --sample SAMPLE
                        Sample name in VCF file to use. Will default to first
                        sample (alphabetically) if not supplied
  -q QUALITY, --quality QUALITY
                        Minimum genotype quality (default 20)
  -nq NON_VARIANT_QUALITY, --non-variant-quality NON_VARIANT_QUALITY
                        Minimum genotype quality for non-variant records
                        (default 20)
  -b, --bedgraph        Output in bedgraph mode

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

gvcf2bed-0.3.1.tar.gz (5.2 kB 查看哈希值)

上传时间:

构建分发

gvcf2bed-0.3.1-py3-none-any.whl (5.2 kB 查看哈希值)

上传于 Python 3

支持者