跳转到主要内容

用于解析地球系统模型(ESM)目录并将netCDF文件和/或Zarr存储加载到Xarray数据集中的intake插件。

项目描述

Intake-esm

徽章

CI GitHub Workflow Status Code Coverage Status pre-commit.ci status
文档 Documentation Status
Conda PyPI
许可证 License
引用 Zenodo

动机

对地球气候和天气的计算机模拟产生了大量数据。这些数据通常存储在HPC系统或云中,跨越多种格式的多个数据资产(例如netCDFzarr等)。寻找、调查、将这些数据资产加载到计算准备好的数据容器中需要时间和精力。数据用户在加载和分析了特定数据集之前,需要了解可用的数据集以及描述每个数据集的属性。

由于用户可能感兴趣的文件数量庞大,将这些资产加载到数据数组容器(如xarray)中可能是一项艰巨的任务。Intake-esm旨在通过提供搜索、发现、数据访问/加载的必要功能来解决这些问题。

概述

intake-esm 是一个数据目录工具,它基于 intakepandasxarray 构建,非常出色!

  • 打开ESM目录定义文件:地球系统模型(ESM)目录文件是一个符合ESM集合规范的JSON文件。当提供一个esm目录文件的链接/路径时,intake-esm 会建立到一个数据库(CSV文件)的链接,该数据库包含数据资产的位置和相关元数据(例如,实验、模型来源)。目录JSON文件可以存储在本地文件系统上,也可以托管在远程服务器上。

    In [1]: import intake
    
    In [2]: import intake_esm
    
    In [3]: cat_url = intake_esm.tutorial.get_url("google_cmip6")
    
    In [4]: cat = intake.open_esm_datastore(cat_url)
    
    In [5]: cat
    Out[5]: <GOOGLE-CMIP6 catalog with 4 dataset(s) from 261 asset(s>
    
  • 搜索和发现:intake-esm 提供了对目录执行查询的功能

    In [5]: cat_subset = cat.search(
       ...:     experiment_id=["historical", "ssp585"],
       ...:     table_id="Oyr",
       ...:     variable_id="o2",
       ...:     grid_label="gn",
       ...: )
    
    In [6]: cat_subset
    Out[6]: <GOOGLE-CMIP6 catalog with 4 dataset(s) from 261 asset(s)>
    
  • 访问:当用户对查询结果满意时,他们可以将数据资产(netCDF和/或Zarr存储)加载到xarray数据集中

      In [7]: dset_dict = cat_subset.to_dataset_dict()
    
      --> The keys in the returned dictionary of datasets are constructed as follows:
              'activity_id.institution_id.source_id.experiment_id.table_id.grid_label'
      |███████████████████████████████████████████████████████████████| 100.00% [2/2 00:18<00:00]
    

有关更多信息,请参阅文档

安装

可以使用pip从PyPI安装Intake-esm

python -m pip install intake-esm

它还可在conda-forge中通过conda安装

conda install -c conda-forge intake-esm

项目详情


下载文件

下载适合您平台文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

intake-esm-2024.2.6.tar.gz (112.0 kB 查看哈希值)

上传时间

构建分布

intake_esm-2024.2.6-py3-none-any.whl (29.7 kB 查看哈希值)

上传时间 Python 3

由...

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面