跳转到主要内容

用于训练和评估生物知识图谱嵌入的软件包

项目描述

BioKEEN (生物知识嵌入) 是一个基于PyKEEN的用于训练和评估生物知识图谱嵌入的软件包。

由于我们使用PyKEEN作为底层软件包,目前BioKEEN提供10种知识图谱嵌入模型的实现。此外,BioKEEN可以在训练模式下运行,用户可以提供自己的超参数值集,或者在超参数优化模式下从用户定义的值集中找到合适的超参数值。

通过集成Bio2BEL软件,BioKEEN中可以直接访问大量生物医学数据库。

即使没有编程经验,您也可以通过使用其交互式命令行界面来运行BioKEEN,该界面可以通过在终端中输入“biokeen”命令来启动。

分享您的实验工件

您可以通过KEEN-Model-Zoo分享您训练的KGE模型以及其他实验工件。

教程

关于如何开始使用BioKEEN的简要教程在此可用。

https://i.vimeocdn.com/video/755767182.jpg?mw=1100&mh=619&q=70

更多教程可以在notebooks目录和我们的文档中找到。

引用

如果您在工作中发现BioKEEN很有用,请考虑引用以下内容

注意:ComPath已更新,因此我们已上传了我们用于实验的数据集版本:数据集

安装 当前PyPI版本 稳定的支持Python版本 MIT许可证

要安装biokeen,需要Python 3.6+,我们建议在Linux或Mac OS系统上安装。请运行以下命令

$ pip install git+https://github.com/SmartDataAnalytics/BioKEEN.git

或者,可以从源代码进行开发安装

$ git clone https://github.com/SmartDataAnalytics/BioKEEN.git biokeen
$ cd biokeen
$ pip install -e .

贡献

贡献,无论是提交问题、提交拉取请求还是分叉,都受到欢迎。有关参与方式的信息,请参阅CONTRIBUTING.rst

CLI使用

要显示BioKEEN的可用命令,请运行以下命令

biokeen

启动训练/HPO管道 - 在60秒内设置您的实验

要通过CLI配置实验,请运行以下命令

biokeen start

要使用现有配置文件启动BioKEEN,请运行以下命令

biokeen start -f /path/to/config.json

启动预测管道

要基于训练的模型进行预测,请运行以下命令

biokeen predict -m /path/to/model/directory -d /path/to/data/directory

其中,参数-m的值是包含模型的目录,更详细地说,该目录必须包含以下文件

  • configuration.json

  • entities_to_embeddings.json

  • relations_to_embeddings.json

  • trained_model.pkl

这些文件在模型训练(和评估)后自动创建,并导出到您指定的输出目录中。

参数-d的值是包含应应用推理的数据的目录,它需要包含以下文件

  • entities.tsv

  • relations.tsv

其中,entities.tsv包含所有感兴趣的实体,而relations.tsv包含所有关系。这两个文件都应该包含一个单列,包含所有实体/关系。基于这些文件,PyKEEN将创建所有三元组排列,并计算它们的预测,并将它们保存在数据目录中的predictions.tsv中。

总结所有实验的结果

要总结所有实验的结果,请运行以下命令

biokeen summarize -d /path/to/experiments/directory -o /path/to/output/file.csv

获取Bio2BEL数据

要从Bio2BEL存储库下载和结构化数据,请运行以下命令

biokeen data get <name>

其中,<name>可以是Bio2BEL中的任何存储库名称,例如hippiemirtarbase

参考文献

项目详情


下载文件

下载您平台对应的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

biokeen-0.0.14.tar.gz (271.7 kB 查看哈希值)

上传时间 源代码

构建分发

biokeen-0.0.14-py3-none-any.whl (17.2 kB 查看哈希值)

上传时间 Python 3

由支持