跳转到主要内容

从较小的数据切片中稳健地创建和更新Zarr数据立方体的工具

项目描述

 zappend

CI codecov PyPI Version Conda Version Code style: black Binder GitHub License


zappend 是一个用Python编写的工具,用于从较小的数据集切片中稳健地创建和更新Zarr数据立方体。它基于出色的Python包 xarrayzarr 构建。

动机

zappend 的目标是使地理数据科学家和开发者能够稳健地创建大型数据立方体。该工具执行基于事务的数据集追加操作,以现有的 Zarr格式 中的数据立方体。如果在追加步骤中发生错误(通常是由于I/O问题或内存不足条件),zappend 将自动回滚操作,确保现有的数据立方体保持其结构完整性。zappend背后的设计驱动因素首先是易用性,其次是关于文件系统、数据源类型、数据立方体概要和编码的高度可配置性。

该工具包括命令行界面、Python API以进行程序控制,以及易于理解的文档,以指导用户有效地使用。您可以使用 pip install zappendconda install -conda-forge zappend 简单地安装 zappend 作为普通Python包。

功能

zappend 工具提供以下功能

  • 锁定:在修改目标数据集时,创建文件锁,有效地防止并发数据集修改。
  • 基于事务的数据集追加:在追加步骤失败时,事务将被回滚,以确保目标数据集保持有效并保持其完整性。
  • 文件系统透明性:目标数据集可以在任何由 fsspec 包支持的可写文件系统中生成和更新。同样适用于要追加的切片数据集。
  • 数据集轮询:该工具可以配置为等待切片数据集可用。
  • 动态属性:使用 {{ 表达式 }} 语法来使用动态计算的属性值更新目标数据集。
  • 命令行界面和Python API:可以使用 zappend 命令在shell中使用该工具,或从Python中调用。当使用Python中的 zappend() 函数时,切片数据集可以作为本地文件路径、URI、类型为 xarray.Dataset 的数据集或自定义 切片源 传递。

有关zappend的更多信息,请参阅其 文档

项目详情


下载文件

下载适合您平台的应用程序文件。如果您不确定选择哪一个,请了解有关 安装包 的更多信息。

源分布

zappend-0.8.0.tar.gz (52.6 kB 查看哈希值)

上传时间

构建分布

zappend-0.8.0-py3-none-any.whl (52.7 kB 查看哈希值)

上传时间 Python 3

由以下组织支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面