可移植的Python包,用于处理公开可用的基因注释集合,例如基因本体和疾病本体术语。
项目描述
Annotation Refinery Python包包含处理公开可用的基因注释集合(如基因本体和疾病本体术语)的功能。
配置文件
Annotation Refinery需要在主目录中至少包含两个.ini配置文件才能运行
一个包含主要配置设置的main_config.ini文件,
至少一个<species>.ini文件,其中将包含该物种所需注释文件的存储位置等。用户可以在主目录中添加配置文件,以便处理尽可能多的物种。
可选的,还可以有一个secrets.ini文件,其中存储像用户名和密码这样的值,用于访问受限制的URL。
主要配置文件
主要配置文件包括设置,如物种文件的存储位置、精炼器输出(处理后的基因集)应加载到的位置、注释文件应下载到的位置,以及可选的秘密文件的存储位置。
[main]
SECRETS_FILE: secrets.ini
PROCESS_TO: Tribe
# All other download folders in this files should be folders within
# this root folder
[download_folder]
BASE_DOWNLOAD_FOLDER: download_files
[Tribe parameters]
TRIBE_URL: https://tribe.greenelab.com
[species files]
SPECIES_FILES: human.ini
物种文件
每个物种文件应包含要下载的所需注释文件的URL。
# File for human settings
[species_info]
SCIENTIFIC_NAME: Homo sapiens
TAXONOMY_ID: 9606
SPECIES_DOWNLOAD_FOLDER: download_files/Human
# ***********************************************
# Below, add as sections the types of annotations
# that should be downloaded and processed
# ***********************************************
[GO]
DOWNLOAD: TRUE
GO_OBO_URL: ftp://ftp.geneontology.org/go/ontology/obo_format_1_2/gene_ontology.1_2.obo
ASSOC_FILE_URL: ftp://ftp.geneontology.org/go/gene-associations/gene_association.goa_human.gz
EVIDENCE_CODES: EXP, IDA, IPI, IMP, IGI, IEP
TAG_MAPPING_FILE: tag_mapping_files/brenda-gobp-all_mapping.dir.v2.txt
GO_ID_COLUMN: 2
GO_NAME_COLUMN: 3
TAG_COLUMN: 1
TAG_FILE_HEADER: TRUE
[KEGG]
DOWNLOAD: TRUE
KEGG_ROOT_URL: http://rest.kegg.jp
DB_INFO_URL: /info/kegg
SETS_TO_DOWNLOAD: /link/hsa/pathway, /link/hsa/module, /link/hsa/disease
SET_INFO_DIR: /get/
# This is the type of gene identifier used by KEGG for this species
XRDB: Entrez
[DO]
DOWNLOAD: TRUE
DO_OBO_URL: http://sourceforge.net/p/diseaseontology/code/HEAD/tree/trunk/HumanDO.obo?format=raw
MIM2GENE_URL: http://omim.org/static/omim/data/mim2gene.txt
GENEMAP_URL: http://data.omim.org/downloads/<SecretKey>/genemap.txt
# This is the type of gene identifier used by DO
XRDB: Entrez
TAG_MAPPING_FILE: tag_mapping_files/tissue-disease_curated-associations.txt
DO_ID_COLUMN: 2
DO_NAME_COLUMN: 3
TAG_COLUMN: 1
TAG_FILE_HEADER: TRUE
秘密文件
秘密文件包含数据库的用户名和密码、API的秘密密钥等,从这些API中下载注释文件。
[OMIM API secrets]
SECRET_KEY: ExampleSecretKey
[Tribe secrets]
TRIBE_ID: asdf1234
TRIBE_SECRET: qwerty1234
USERNAME: example_username
PASSWORD: password
获取OMIM API密钥的说明请在此处查看:http://omim.org/downloads
获取Tribe密钥的说明请在此处查看:http://tribe-greenelab.readthedocs.io/en/latest/api.html#creating-new-resources-through-tribe-s-api
项目详情
关闭
annotation-refinery-1.0.2.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 64e2b12b315ad3ba05781f614fabafa7ba07e5e63d69f0d7806c294fe8227a8f |
|
MD5 | 1c7dbd44817031233941ce404a8fee81 |
|
BLAKE2b-256 | 0f24406739cfe0bde3b2e6a2dbdca25325d48f583bd60415a62b11ba7bf5742d |