多模态数据
项目描述
MuData – 多模态数据
有关在多模态组学应用中使用 MuData
的信息,请参阅 muon
。
数据结构
与AnnData类似,MuData旨在在Python中表示单模态注释数据集,MuData旨在提供加载、处理和存储多模态组学数据的功能。
MuData
.obs -- annotation of observations (cells, samples)
.var -- annotation of features (genes, genomic loci, etc.)
.obsm -- multidimensional cell annotation,
incl. a boolean for each modality
that links .obs to the cells of that modality
.varm -- multidimensional feature annotation,
incl. a boolean vector for each modality
that links .var to the features of that modality
.mod
AnnData
.X -- data matrix (cells x features)
.obs -- cell metadata (assay-specific)
.var -- annotation of features (genes, peaks, genomic sites)
.obsm
.varm
.uns
.uns
概述
输入
MuData
可以被视为一个多模态容器,其中每个模态都是一个AnnData对象
from mudata import MuData
mdata = MuData({'rna': adata_rna, 'atac': adata_atac})
如果要读取10X Genomics的多模态数据,muon
提供了方便的读取器,返回一个包含AnnData对象的 MuData
对象,每个对象对应其自己的模态
import muon as mu
mu.read_10x_h5("filtered_feature_bc_matrix.h5")
# MuData object with n_obs × n_vars = 10000 × 80000
# 2 modalities
# rna: 10000 x 30000
# var: 'gene_ids', 'feature_types', 'genome', 'interval'
# atac: 10000 x 50000
# var: 'gene_ids', 'feature_types', 'genome', 'interval'
# uns: 'atac', 'files'
与 .h5mu
文件进行I/O操作
MuData
对象将模态表示为AnnData对象的集合。这些集合可以保存到磁盘上,并使用基于HDF5的 .h5mu
文件检索,其设计基于 .h5ad
文件结构。
import mudata as md
mdata_pbmc.write("pbmc_10k.h5mu")
mdata = md.read("pbmc_10k.h5mu")
它允许有效地使用HDF5文件的分层特性,并直接从/到 .h5mu
文件读取/写入AnnData对象
adata = md.read("pbmc_10k.h5mu/rna")
md.write("pbmc_10k.h5mu/rna", adata)
引用
如果在您的工作中使用 mudata
,请按以下方式引用该出版物
MUON:多模态组学分析框架
丹尼尔·布雷迪欣,伊利亚·卡茨,奥利弗·斯特格尔
基因组生物学 2022年2月1日。doi: 10.1186/s13059-021-02577-8。
您可以按以下方式引用 scverse 出版物
scverse 项目提供单细胞组学数据分析的计算生态系统
伊萨克·维什普,丹尼尔·布雷迪欣,卢卡斯·休莫斯,乔瓦尼·帕拉,格罗戈尔·斯特尔姆,亚当·加约索,伊利亚·卡茨,米卡埃拉·库特鲁利,scverse 社区,波尼·伯格,达娜·佩尔,阿维夫·雷杰夫,莎拉·A·泰克曼,弗朗西斯卡·菲诺特洛,F.亚历山大·沃尔夫,尼尔·约瑟夫,奥利弗·斯特格尔 & 法比安·J. 泰斯
自然生物技术 2023年4月10日。doi: 10.1038/s41587-023-01733-8。
mudata
是 scverse 项目的一部分(网站,治理),并由 NumFOCUS 财务赞助。请考虑为该项目做出可抵扣税款的 捐赠,以帮助项目支付开发者时间、专业服务、旅行、研讨会和各种其他需求。
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。
源分布
构建分布
mudata-0.3.1.tar.gz 的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | 452f166861539c118e99c432725fc6ced6064d96d333413a306cb5b04992b963 |
|
MD5 | b3ca669322cc74c3652d8dec2e82f5fb |
|
BLAKE2b-256 | 5ab04e1f41b749d88758a490a5289d8aabbbad8edc48b6fcc090e945619e4577 |
mudata-0.3.1-py3-none-any.whl 的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | d3a5ce96c3fcb64077be936758cc71657475905a4bbeeeba17c9ff48173f6c9d |
|
MD5 | de70fd6296e8c7cd320716657712ee0e |
|
BLAKE2b-256 | 96107b9588eee1883c269453b44d643ae68e37c93eb78f7b6bdd2838688e957c |