将VCF文件拆分为可理解的制表符分隔文件
项目描述
将VCF文件拆分为可理解的制表符分隔文件。
VCF代表变体调用格式,在生物信息学中被广泛用于保存XX信息,因为它足够灵活,可以存储广泛的数据。尽管它受到CSV文件的启发,以便(我想)使VCF易于人类阅读和机器解析,但它现在在这两方面都做得不太好。它是一种文件格式,其完整规范不能事先给出,因为每个VCF文件都可以自由指定其字段的格式。因此,处理VCF文件中包含的数据的第一步通常是提取其子集,并将提取的数据转换为更易于处理的文件格式。
这个命令行Python包旨在解决上述问题。它将VCF格式拆分为标准的CSV文件,每个文件包含原始VCF文件的不同字段。因此,使它再次易于人类和机器阅读。
安装
假设您有一个最新的Python安装,您将几乎肯定有安装unvcf的所有必要要求。从终端,输入
pip install unvcf
用法
安装后,您可以从终端访问unvcf。在这种情况下,您可以使用以下方式开始使用它
unvcf path_to_file.vcf destination_folder/
这将生成代表path_to_file.vcf原始字段的CSV文件。如需更多信息,您可以输入
unvcf --help
如果您遇到任何问题或有任何疑问,请创建一个新问题,我们将尽快解决。
许可证
本项目受MIT许可证许可。
项目详情
关闭
unvcf-0.1.2.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | efcea32ea52e79ddd459e801b4abcc28817eb4a05afd187380d9007bf86a4072 |
|
MD5 | 70306e9e11043521a047ef3b00b273e9 |
|
BLAKE2b-256 | 02e34a8b1b09fc0da10a402f9c828d8720f360fd65ec9f3d66eabd8b2b8cf6c9 |