跳转到主要内容

多模态数据

项目描述

mudata header

Documentation Status PyPi version Powered by NumFOCUS

MuData – 多模态数据

文档 | 出版物

有关在多模态组学应用中使用 MuData 的信息,请参阅 muon

数据结构

AnnData类似,MuData旨在在Python中表示单模态注释数据集,MuData旨在提供加载、处理和存储多模态组学数据的功能。

MuData
  .obs     -- annotation of observations (cells, samples)
  .var     -- annotation of features (genes, genomic loci, etc.)
  .obsm    -- multidimensional cell annotation, 
              incl. a boolean for each modality
              that links .obs to the cells of that modality
  .varm    -- multidimensional feature annotation, 
              incl. a boolean vector for each modality
              that links .var to the features of that modality
  .mod
    AnnData
      .X    -- data matrix (cells x features)
      .obs  -- cell metadata (assay-specific)
      .var  -- annotation of features (genes, peaks, genomic sites)
      .obsm
      .varm
      .uns
  .uns

概述

输入

MuData 可以被视为一个多模态容器,其中每个模态都是一个AnnData对象

from mudata import MuData

mdata = MuData({'rna': adata_rna, 'atac': adata_atac})

如果要读取10X Genomics的多模态数据,muon 提供了方便的读取器,返回一个包含AnnData对象的 MuData 对象,每个对象对应其自己的模态

import muon as mu

mu.read_10x_h5("filtered_feature_bc_matrix.h5")
# MuData object with n_obs × n_vars = 10000 × 80000 
# 2 modalities
#   rna:	10000 x 30000
#     var:	'gene_ids', 'feature_types', 'genome', 'interval'
#   atac:	10000 x 50000
#     var:	'gene_ids', 'feature_types', 'genome', 'interval'
#     uns:	'atac', 'files'

.h5mu 文件进行I/O操作

MuData 对象将模态表示为AnnData对象的集合。这些集合可以保存到磁盘上,并使用基于HDF5的 .h5mu 文件检索,其设计基于 .h5ad 文件结构。

import mudata as md

mdata_pbmc.write("pbmc_10k.h5mu")
mdata = md.read("pbmc_10k.h5mu")

它允许有效地使用HDF5文件的分层特性,并直接从/到 .h5mu 文件读取/写入AnnData对象

adata = md.read("pbmc_10k.h5mu/rna")
md.write("pbmc_10k.h5mu/rna", adata)

引用

如果在您的工作中使用 mudata,请按以下方式引用该出版物

MUON:多模态组学分析框架

丹尼尔·布雷迪欣,伊利亚·卡茨,奥利弗·斯特格尔

基因组生物学 2022年2月1日。doi: 10.1186/s13059-021-02577-8

您可以按以下方式引用 scverse 出版物

scverse 项目提供单细胞组学数据分析的计算生态系统

伊萨克·维什普,丹尼尔·布雷迪欣,卢卡斯·休莫斯,乔瓦尼·帕拉,格罗戈尔·斯特尔姆,亚当·加约索,伊利亚·卡茨,米卡埃拉·库特鲁利,scverse 社区,波尼·伯格,达娜·佩尔,阿维夫·雷杰夫,莎拉·A·泰克曼,弗朗西斯卡·菲诺特洛,F.亚历山大·沃尔夫,尼尔·约瑟夫,奥利弗·斯特格尔 & 法比安·J. 泰斯

自然生物技术 2023年4月10日。doi: 10.1038/s41587-023-01733-8

mudata 是 scverse 项目的一部分(网站治理),并由 NumFOCUS 财务赞助。请考虑为该项目做出可抵扣税款的 捐赠,以帮助项目支付开发者时间、专业服务、旅行、研讨会和各种其他需求。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分布

mudata-0.3.1.tar.gz (47.1 kB 查看散列)

上传时间

构建分布

mudata-0.3.1-py3-none-any.whl (41.0 kB 查看散列)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面