跳转到主要内容

一个用于生成患者表示的混合数据和知识驱动框架

项目描述

CLEP: 一个用于从任何患者级别数据和其对应的知识图编码的先验知识生成患者表示的混合数据和知识驱动框架
Documentation Status DOI CLEP on PyPI CLEP Python versions CLEP Software License

目录

一般信息

CLEP是一个框架,其中包含从任何患者级别数据及其对应的知识图编码的先验知识生成患者表示的新方法。该框架如图所示

安装

注意:CLEP的安装需要在您的系统上安装R,以及R的limma包。R可以从CRAN下载。使用以下命令在R中安装limma包:

if (!require("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("limma")

可以使用以下命令从PyPI安装代码。

$ pip install clep

可以从GitHub的源代码中安装最新的代码。

$ pip install git+https://github.com/hybrid-kg/clep.git

对于开发者,可以从GitHub克隆仓库,并使用以下命令以可编辑模式安装:

$ git clone https://github.com/hybrid-kg/clep.git
$ cd clep
$ pip install -e .

文档

阅读官方文档以获取更多信息。

输入数据格式

数据

符号 样本_1 样本_2 样本_3
HGNC_ID_1 0.354 2.568 1.564
HGNC_ID_2 1.255 1.232 0.26452
HGNC_ID_3 3.256 1.5 1.5462

注意:数据必须以制表符分隔的文件格式。

设计

文件名 目标
样本_1 异常
样本_2 异常
样本_3 对照

注意:数据必须以制表符分隔的文件格式。

知识图谱

CLEP可以处理的图形格式是Edge List格式的修改版,如下所示

关系 目标
HGNC_ID_1 关联 HGNC_ID_2
HGNC_ID_2 减少 HGNC_ID_3
HGNC_ID_3 增加 HGNC_ID_1

注意:数据必须以制表符分隔的文件格式,如果你的知识图谱中源和目标之间没有关系,只需在关系列中填充"No Relation"。

使用

注意:以下是非常基础的CLEP命令,每个命令的详细选项可以在文档中找到。

  1. 根搜索以下命令基于对照群体找到具有极端特征值的极端样本。
$ clep sample-scoring radical-search --data <DATA_FILE> --design <DESIGN_FILE> --control Control --threshold 2.5 --control_based --ret_summary --out <OUTPUT_DIR>
  1. 图形生成以下命令根据选择的方法(Interaction_network)生成患者-基因网络。
$ clep embedding generate-network --data <SCORED_DATA_FILE> --method interaction_network --ret_summary --out <OUTPUT_DIR>
  1. 知识图谱嵌入

以下命令生成传入网络的嵌入。

$ clep embedding kge --data <NETWORK_FILE> --design <DESIGN_FILE> --model_config <MODEL_CONFIG.json> --train_size 0.8 --validation_size 0.1 --out <OUTPUT_DIR>
  1. 分类

以下命令对给定数据文件执行分类,选择的模型为(弹性网络),进行100次超参数优化试验。

$ clep classify --data <EMBEDDING_FILE> --model elastic_net --num-trials 100 --out <OUTPUT_DIR>

问题

如果您在使用CLEP时遇到困难,请在我们GitHub仓库中打开一个问题。

致谢

引用

如果您在您的工作中发现CLEP很有用,请考虑引用

CLEP: 一个用于从任何患者级别数据和其对应的知识图编码的先验知识生成患者表示的混合数据和知识驱动框架.
Bharadhwaj, V. S., Ali, M., Birkenbihl, C., Mubeen, S., Lehmann, J., Hofmann-Apitius, M., Hoyt, C. T.,& Domingo-Fernandez, D. (2020)。
生物信息学,btab340。

图形

CLEP标志和框架图形由Carina Steinborn设计。

免责声明

CLEP是作为学术能力开发的科学软件,因此不提供任何保修或维护、支持或数据备份的保证。

项目详情


下载文件

下载适用于您平台文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分发

clep-0.0.4.tar.gz (371.9 kB 查看哈希值)

上传时间

构建分发

clep-0.0.4-py3-none-any.whl (38.0 kB 查看哈希值)

上传时间 Python 3

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面