将MaveDB分数集映射到VRS对象
项目描述
dcd-map: 将MaveDB数据映射到可计算和可互操作的变体对象
此库实现了一种将MaveDB分数集数据映射到GA4GH变异表示规范(VRS)对象的新方法,增强了基因组医学应用的互操作性。请参阅Arbesfeld等(2023)的映射手稿预印本,或直接下载结果映射。
先决条件
- 通用转录本存档(UTA):请参阅README获取设置说明。本地设备有Docker访问权限的用户可以使用可用的Docker镜像;否则,启动一个相对较新的(版本14+)PostgreSQL实例,并添加从可用数据库转储中获取的数据。
- SeqRepo:请参阅README获取设置说明。SeqRepo数据目录必须是可写的;有关更多信息,请参阅此处的具体说明。
- 基因标准化器:请参阅文档获取数据设置说明。
- blat:必须在本地PATH中可用并由用户执行。否则,可以通过
BLAT_BIN_PATH
环境变量手动设置其位置。请参阅UCSC基因组浏览器FAQ获取下载说明。
安装
从PyPI安装
python3 -m pip install dcd-mapping
用法
使用dcd-map
命令与scoreset URN一起使用,例如
$ dcd-map urn:mavedb:00000083-c-1
输出以<URN>_mapping_results_<ISO datetime>.json
的格式保存在由环境变量MAVEDB_STORAGE_DIR
指定的目录中,默认情况下为~/.local/share/dcd-mapping
。
使用dcd-map --help
查看其他可用选项。
笔记本
手稿数据分析和大图生成的笔记本包含在notebooks/analysis
中。有关更多信息,请参阅notebooks/analysis/README.md
。
开发
克隆存储库
git clone https://github.com/ave-dcd/dcd_mapping
cd dcd_mapping
创建并激活虚拟环境
python3 -m virtualenv venv
source venv/bin/activate
以可编辑方式安装并带有开发依赖项
python3 -m pip install -e '.[dev,tests]'
添加预提交钩子
pre-commit install
使用pytest
运行测试
pytest
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源分布
dcd_mapping-0.1.3.tar.gz (3.2 MB 查看哈希值)
构建分布
dcd_mapping-0.1.3-py3-none-any.whl (38.7 kB 查看哈希值)