两栖式新数据转换器,用于为CGP DSS数据加载器准备各种数据源
项目描述
newt-transformer
元数据转换器,用于将gen3转换为cgp-dss-data-loader可读取的格式
常见设置
-
(可选) 我们建议使用Python 3 虚拟环境。
-
运行
pip3安装newt-transformer
开发设置
-
克隆存储库
git clone https://github.com/jessebrennan/newt-transformer.git
-
转到克隆项目的根目录
cd newt-transformer
-
运行(最好在一个新的 虚拟环境 中)
make develop
运行测试
-
确保您已按照开发设置进行操作
-
运行
make test
从sheepdog-exporter转换数据
-
第一步是使用 sheepdog导出器 提取您想要的Gen3数据。从sheepdog提取的TopMed公共数据可在Assets下 发布页面 获取。假设您使用此数据,您现在将有一个名为
topmed-public.json
的文件 -
请确保您正在运行在“设置”说明中设置的虚拟环境。
-
现在我们需要转换数据。从项目的根目录运行
newt new /path/to/topmed-public.json --output-json transformed-topmed-public.json
这将生成一个名为
transformed-topmed-public.json
的转换输出文件。参数
new
指定我们想要最新的变压器输出格式。它可以被gen3
参数替换,但这个较旧的格式将很快被弃用。 -
你可能想要将此数据上传到DSS。有关说明,请参阅DSS数据加载仓库。
变压器架构
项目详情
关闭
newt-transformer-0.1.7.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 85e2dad8ace31b747a570311619f5025cbb5daf3b4c93a76967819fa51cf1749 |
|
MD5 | 58764d8448e9addc8736de34e8b096e6 |
|
BLAKE2b-256 | a4a092d4788855e8edc13ccbfa39fbd22aa84a4fca7c58eca4ebb0aa2b46dbd1 |