用于训练和评估生物知识图谱嵌入的软件包
项目描述
BioKEEN (生物知识嵌入) 是一个基于PyKEEN的用于训练和评估生物知识图谱嵌入的软件包。
由于我们使用PyKEEN作为底层软件包,目前BioKEEN提供10种知识图谱嵌入模型的实现。此外,BioKEEN可以在训练模式下运行,用户可以提供自己的超参数值集,或者在超参数优化模式下从用户定义的值集中找到合适的超参数值。
通过集成Bio2BEL软件,BioKEEN中可以直接访问大量生物医学数据库。
即使没有编程经验,您也可以通过使用其交互式命令行界面来运行BioKEEN,该界面可以通过在终端中输入“biokeen”命令来启动。
教程
关于如何开始使用BioKEEN的简要教程在此处可用。
更多教程可以在notebooks目录和我们的文档中找到。
引用
如果您在工作中发现BioKEEN很有用,请考虑引用以下内容
注意:ComPath已更新,因此我们已上传了我们用于实验的数据集版本:数据集
安装

要安装biokeen,需要Python 3.6+,我们建议在Linux或Mac OS系统上安装。请运行以下命令
$ pip install git+https://github.com/SmartDataAnalytics/BioKEEN.git
或者,可以从源代码进行开发安装
$ git clone https://github.com/SmartDataAnalytics/BioKEEN.git biokeen
$ cd biokeen
$ pip install -e .
贡献
贡献,无论是提交问题、提交拉取请求还是分叉,都受到欢迎。有关参与方式的信息,请参阅CONTRIBUTING.rst。
CLI使用
要显示BioKEEN的可用命令,请运行以下命令
biokeen
启动训练/HPO管道 - 在60秒内设置您的实验
要通过CLI配置实验,请运行以下命令
biokeen start
要使用现有配置文件启动BioKEEN,请运行以下命令
biokeen start -f /path/to/config.json
启动预测管道
要基于训练的模型进行预测,请运行以下命令
biokeen predict -m /path/to/model/directory -d /path/to/data/directory
其中,参数-m的值是包含模型的目录,更详细地说,该目录必须包含以下文件
configuration.json
entities_to_embeddings.json
relations_to_embeddings.json
trained_model.pkl
这些文件在模型训练(和评估)后自动创建,并导出到您指定的输出目录中。
参数-d的值是包含应应用推理的数据的目录,它需要包含以下文件
entities.tsv
relations.tsv
其中,entities.tsv包含所有感兴趣的实体,而relations.tsv包含所有关系。这两个文件都应该包含一个单列,包含所有实体/关系。基于这些文件,PyKEEN将创建所有三元组排列,并计算它们的预测,并将它们保存在数据目录中的predictions.tsv中。
总结所有实验的结果
要总结所有实验的结果,请运行以下命令
biokeen summarize -d /path/to/experiments/directory -o /path/to/output/file.csv
获取Bio2BEL数据
要从Bio2BEL存储库下载和结构化数据,请运行以下命令
biokeen data get <name>
其中,<name>可以是Bio2BEL中的任何存储库名称,例如hippie、mirtarbase。
参考文献
Hoyt, C.,等。(2019)。使用生物表达式语言集成结构化生物数据源。《bioRxiv》,631812。
项目详情
下载文件
下载您平台对应的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源代码分发
构建分发
biokeen-0.0.14.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 63a13217bd33bb938ad085bc7cfbdbf0b04c2ba6679bf3d245991a56f56eb50a |
|
MD5 | 60edd7ec57bfa793b4329a9c0e1e74e2 |
|
BLAKE2b-256 | dce696b1415378bb1c6579900dd7265a72ff8eb0842996a6e7a8184faaa48eec |
biokeen-0.0.14-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 7b965e246a1709fdd7859306176f251bb82c4ed60d4f24a65ef53847ae998382 |
|
MD5 | 00acf7a897e1b43b9d11ccd6aa594893 |
|
BLAKE2b-256 | b0d59ad943e7b929859d6c4d2ac834482376048f3d93766acf303c45323d3425 |