跳转到主要内容

将SNP数组转换为VCF

项目描述

Array As VCF

array-as-vcf 是一个小的库和工具,可以将常见的SNP数组格式转换为VCF格式。

目前支持四种数组格式

  • Affymetrix (TSV导出)
  • Cytoscan HD Array (TSV导出)
  • Lumi 317k数组 (TSV导出)
  • Lumi 370k数组 (TSV导出)
  • 多样本OpenArray (TSV导出)

目前不支持二进制格式。

需求

  • Python 3.6
  • requests

CLI使用

array-as-vcf 工具将数组文件转换为VCF格式。它将自动检测数组文件的类型,如果不能确定,将抛出错误。

生成的VCF文件将打印到标准输出。

必须提供用于VCF文件中的样本名称。

如果没有提供lookup-table,将查询Ensembl以获取REF和ALT等位基因。这需要一个正常工作的互联网连接,并且可能会相当慢,因为需要大量的HTTP请求。

当提供lookup-table时,不会对查找表中存在的rsIDs发起请求。查找表是一个JSON文件,包含一个形状为的单个大对象

{
  "rs0": "{ref_allele}:{alt_alleles}:{ref_is_minor_allele}"
}

例如:

{
  "rs1000003": "A:G:F"
}

如果你以前从未运行过array-as-vcf,你可以不使用查找表运行array-as-vcf,并将生成的内部查找表导出到文件,以便下次迭代使用。

Usage: array-as-vcf [OPTIONS]

Options:
  -p, --path PATH              Path to array file  [required]
  -b, --build [GRCh37|GRCh38]
  -s, --sample-name TEXT       Name of sample in VCF file
  -c, --chr-prefix TEXT        Optional prefix to chromosome names
  -l, --lookup-table PATH      Optional path to existing lookup table for
                               rsIDs.
  -d, --dump PATH              Optional path to write generated lookup table
  --help                       Show this message and exit.

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

array-as-vcf-1.1.0.tar.gz (12.2 kB 查看哈希值)

上传时间:

构建分发

array_as_vcf-1.1.0-py3-none-any.whl (13.3 kB 查看哈希值)

上传时间: Python 3

由以下支持