用于构建GO-CAM模型RDF的Python库
项目描述
gocamgen
构建GO-CAM模型RDF的基础仓库
安装
pip install gocamgen
测试
python3 test_gocamgen.py
使用
from gocamgen.gocamgen import GoCamModel
model = GoCamModel("model title")
model.declare_class("PomBase:SPBC12C2.02c")
uri_a = model.declare_individual("GO:0016757")
uri_b = model.declare_individual("PomBase:SPBC12C2.02c")
axiom = model.add_axiom(uri_a, URIRef(expand_uri("RO:0002333")), uri_b)
model.add_evidence(axiom, "EXP", "PMID:1234567")
model.write("output_file.ttl")
从GPAD快速生成模型
指定源GPAD文件。所有可能的模型都将生成并导出到.ttl
。
python3 gen_models_by_gene.py --gpad_file wb.gpad
此外,可以指定基因产物标识符以仅翻译和导出该GP的模型。
python3 gen_models_by_gene.py --gpad_file wb.gpad --specific_gene WB:WBGene00004055
通常,注释行将根据基因产物标识符(第2列)分组,一些行由于各种证据代码/参考规则而被过滤掉。
生成注释扩展使用电子表格
为了清楚起见,这创建了一个汇总所有“模式”(例如happens_during(GO:P)
,positively_regulates(GO:P)
)的电子表格,这些模式根据当前脚本中编码的规则被判定为无效。这些相同的规则也用于模型生成导入。
从单个GPAD文件生成电子表格的示例
python3 gpad_extensions_mapper.py --filename wb.gpad --out_file bad_extensions.tsv
从GPAD目录生成电子表格(结果汇总到一个.ts文件)的示例
python3 gpad_extensions_mapper.py --dir gpad_files/ --out_file bad_extensions.tsv
创建的电子表格的片段
方面 | 总数 | 扩展 | UniProt | WB | ParkinsonsUK-UCL |
---|---|---|---|---|---|
F | 2 | happens_during(GO:P),happens_during(WBls) | 2 | 0 | 0 |
F | 2 | happens_during(WBls) | 0 | 2 | 0 |
F | 4 | regulates_activity_of(geneID) | 0 | 4 | 0 |
F | 1 | occurs_in(WBbt),part_of(GO:P) | 1 | 0 | 0 |
F | 3 | occurs_in(WBbt) | 2 | 1 | 0 |
F | 1 | activated_by(geneID) | 0 | 1 | 0 |
通过“扩展模式”钻取违规的GPAD行
如果您想获取包含无效扩展模式的实际GPAD,只需将模式复制粘贴到--pattern
选项中,然后在相同的GPAD(s)上重新运行即可。
python3 gpad_extensions_mapper.py --filename wb.gpad --pattern "regulates_activity_of(geneID)"
默认情况下,这将输出到[pattern].gpad
文件,例如regulates_activity_of(geneID).gpad
,但可以使用--pattern_outfile
覆盖。还有一个选项可以同时运行多个模式,通过将换行符分隔的模式的路径插入到--pattern_sourcefile
中,这将创建多个以每个模式命名的GPAD文件。
项目细节
关闭
gocamgen-0.0.5.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 715f4959077bf7dd44f34cd82e40609b5c87a06b5820f4d706cb57ecf56069aa |
|
MD5 | 281bc170b66aa5d83797840204901c70 |
|
BLAKE2b-256 | 8c3b42fedad038748148f8f27e9565da6d06c606376523a37a08d5b7c84bb34b |