将SNP数组转换为VCF
项目描述
Array As VCF
array-as-vcf
是一个小的库和工具,可以将常见的SNP数组格式转换为VCF格式。
目前支持四种数组格式
- Affymetrix (TSV导出)
- Cytoscan HD Array (TSV导出)
- Lumi 317k数组 (TSV导出)
- Lumi 370k数组 (TSV导出)
- 多样本OpenArray (TSV导出)
目前不支持二进制格式。
需求
- Python 3.6
- requests
CLI使用
array-as-vcf
工具将数组文件转换为VCF格式。它将自动检测数组文件的类型,如果不能确定,将抛出错误。
生成的VCF文件将打印到标准输出。
必须提供用于VCF文件中的样本名称。
如果没有提供lookup-table
,将查询Ensembl以获取REF和ALT等位基因。这需要一个正常工作的互联网连接,并且可能会相当慢,因为需要大量的HTTP请求。
当提供lookup-table
时,不会对查找表中存在的rsIDs发起请求。查找表是一个JSON文件,包含一个形状为的单个大对象
{
"rs0": "{ref_allele}:{alt_alleles}:{ref_is_minor_allele}"
}
例如:
{
"rs1000003": "A:G:F"
}
如果你以前从未运行过array-as-vcf
,你可以不使用查找表运行array-as-vcf
,并将生成的内部查找表导出到文件,以便下次迭代使用。
Usage: array-as-vcf [OPTIONS]
Options:
-p, --path PATH Path to array file [required]
-b, --build [GRCh37|GRCh38]
-s, --sample-name TEXT Name of sample in VCF file
-c, --chr-prefix TEXT Optional prefix to chromosome names
-l, --lookup-table PATH Optional path to existing lookup table for
rsIDs.
-d, --dump PATH Optional path to write generated lookup table
--help Show this message and exit.
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源代码分发
array-as-vcf-1.1.0.tar.gz (12.2 kB 查看哈希值)
构建分发
array_as_vcf-1.1.0-py3-none-any.whl (13.3 kB 查看哈希值)
关闭
array-as-vcf-1.1.0.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 6f8c88b8c6f7ca4e6dec7625cafba97b0616190ffbc09952ab61aa40f95a099b |
|
MD5 | d321d86504d321656720390ba3a6ec97ae3145cdac1fd4857d177016a2812b19 |
|
BLAKE2b-256 | cbc10d27fa9c2bc6ab2cd87e3ada18a60c9a7d045f64620da5410a45e3604700 |
关闭
Hashes for array_as_vcf-1.1.0-py3-none-any.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 7979f84ad23a86567263d90ba3a6ec97ae3145cdac1fd4857d177016a2812b19 |
|
MD5 | a4de353629f114c6758d791f455ef4a1 |
|
BLAKE2b-256 | 3d91d0297acf04df4231b00178e5df889d60e7d999c2d861591e967447c2a177 |