跳转到主要内容

用于构建GO-CAM模型RDF的Python库

项目描述

gocamgen

构建GO-CAM模型RDF的基础仓库

安装

pip install gocamgen

测试

python3 test_gocamgen.py

使用

from gocamgen.gocamgen import GoCamModel

model = GoCamModel("model title")
model.declare_class("PomBase:SPBC12C2.02c")
uri_a = model.declare_individual("GO:0016757")
uri_b = model.declare_individual("PomBase:SPBC12C2.02c")
axiom = model.add_axiom(uri_a, URIRef(expand_uri("RO:0002333")), uri_b)
model.add_evidence(axiom, "EXP", "PMID:1234567")

model.write("output_file.ttl")

从GPAD快速生成模型

指定源GPAD文件。所有可能的模型都将生成并导出到.ttl

python3 gen_models_by_gene.py --gpad_file wb.gpad

此外,可以指定基因产物标识符以仅翻译和导出该GP的模型。

python3 gen_models_by_gene.py --gpad_file wb.gpad --specific_gene WB:WBGene00004055

通常,注释行将根据基因产物标识符(第2列)分组,一些行由于各种证据代码/参考规则而被过滤掉。

生成注释扩展使用电子表格

为了清楚起见,这创建了一个汇总所有“模式”(例如happens_during(GO:P)positively_regulates(GO:P))的电子表格,这些模式根据当前脚本中编码的规则被判定为无效。这些相同的规则也用于模型生成导入。

从单个GPAD文件生成电子表格的示例

python3 gpad_extensions_mapper.py --filename wb.gpad --out_file bad_extensions.tsv

从GPAD目录生成电子表格(结果汇总到一个.ts文件)的示例

python3 gpad_extensions_mapper.py --dir gpad_files/ --out_file bad_extensions.tsv

创建的电子表格的片段

方面 总数 扩展 UniProt WB ParkinsonsUK-UCL
F 2 happens_during(GO:P),happens_during(WBls) 2 0 0
F 2 happens_during(WBls) 0 2 0
F 4 regulates_activity_of(geneID) 0 4 0
F 1 occurs_in(WBbt),part_of(GO:P) 1 0 0
F 3 occurs_in(WBbt) 2 1 0
F 1 activated_by(geneID) 0 1 0

通过“扩展模式”钻取违规的GPAD行

如果您想获取包含无效扩展模式的实际GPAD,只需将模式复制粘贴到--pattern选项中,然后在相同的GPAD(s)上重新运行即可。

python3 gpad_extensions_mapper.py --filename wb.gpad --pattern "regulates_activity_of(geneID)"

默认情况下,这将输出到[pattern].gpad文件,例如regulates_activity_of(geneID).gpad,但可以使用--pattern_outfile覆盖。还有一个选项可以同时运行多个模式,通过将换行符分隔的模式的路径插入到--pattern_sourcefile中,这将创建多个以每个模式命名的GPAD文件。

项目细节


下载文件

下载您平台对应的文件。如果您不确定该选择哪个,请了解有关安装包的更多信息。

源分布

gocamgen-0.0.5.tar.gz (28.6 kB 查看哈希值)

上传时间

支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面