变异体归一化程序
项目描述
变异体归一化
变异术语归一化的服务和指南
后端服务
变异体归一化依赖于一些本地数据缓存,您需要自行设置。它使用pipenv来管理其环境,您也需要安装它。
安装
变异体归一化依赖于seqrepo,您必须自行下载。
从存储库的variant目录
pipenv sync
pip install seqrepo
mkdir -p data/seqrepo
seqrepo -r data/seqrepo pull -i 2021-01-29
sudo chmod -R u+w data/seqrepo
cd data/seqrepo
seqrepo_date_dir=$(ls -d */)
sudo mv $seqrepo_date_dir latest
变异体归一器还使用uta。
要安装
uta_v=uta_20180821
docker pull biocommons/uta:$uta_v
export UTA_DB_URL=postgresql://anonymous@localhost:5432/uta/uta_20180821
docker-compose -f docker-compose.yml up
数据
变异体归一化使用Ensembl BioMart检索variant/data/transcript_mappings.tsv
。我们目前使用Human Genes (GRCh38.p13)
数据集,以下是我们使用的属性:基因稳定ID、基因稳定ID版本、转录本稳定ID、转录本稳定ID版本、蛋白质稳定ID、蛋白质稳定ID版本、RefSeq匹配转录本(MANE Select)、基因名称。
设置基因标准化器
变异标准化 normalize
端点依赖于基因标准化的数据。为了安装
pip install gene-normalizer
设置,请按照基因标准化README中的说明进行。
您必须让基因标准化器 DynamoDB 运行,才能使变异 normalize
端点正常工作。
初始化编码风格测试
编码风格由 flake8 管理,并在提交前进行检查。
我们使用 pre-commit 运行一致性测试。
这确保了
- 检查代码风格
- 检查添加的大文件
- 检测 AWS 凭据
- 检测私钥
在第一次提交之前运行
pre-commit install
测试
从存储库的 根 目录开始
pytest tests/
启动变异标准化服务
gene-normalizer
dynamodb 必须运行,并执行以下操作
docker-compose -f docker-compose.yml up
从存储库的 根 目录开始
uvicorn variant.main:app --reload
接下来,在本地机器上查看 OpenAPI 文档: http://127.0.0.1:8000/variant
项目详情
下载文件
下载适合您平台的项目文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源分布
variant-normalizer-0.2.4.tar.gz (69.7 kB 查看哈希值)