Python中的N维标签数组和数据集
项目描述
xarray:N维标签数组和数据集
xarray(发音为“ex-array”,以前称为xray)是一个开源项目,也是一个Python包,它使处理带标签的多维数组变得简单、高效和有趣!
Xarray在原始类似NumPy的数组之上引入了维度、坐标和属性标签,这使得开发者的体验更加直观、简洁且错误率更低。该包包含一个庞大且不断增长的领域无关函数库,用于对这些数据结构进行高级分析和可视化。
Xarray受到了流行的数据分析包pandas的启发,并大量借鉴了其内容,pandas专注于带标签的表格数据。Xarray特别适用于处理netCDF文件,这些文件是xarray数据模型的来源,并且与dask进行了紧密集成以实现并行计算。
为什么选择xarray?
多维数组(也称为N维数组,简称ND)是计算科学的一个基本组成部分。它们在物理、天文、地质科学、生物信息学、工程、金融和深度学习等广泛领域都有应用。在Python中,NumPy提供了处理原始ND数组的根本数据结构和API。然而,现实世界的数据集通常不仅仅是原始数字;它们有标签,这些标签编码了数组值如何映射到空间、时间等位置的信息。
Xarray不仅跟踪数组的标签,还使用它们提供一个强大且简洁的接口。例如
- 通过名称应用维度的操作:
x.sum('time')
。 - 通过标签而不是整数位置选择值:
x.loc['2014-01-01']
或x.sel(time='2014-01-01')
。 - 根据维度名称而不是形状进行向量化操作(例如,
x - y
),执行数学操作。 - 使用groupby进行灵活的分割-应用-组合操作:
x.groupby('time.dayofyear').mean()
。 - 基于坐标标签的数据库对齐,可以平滑处理缺失值:
x, y = xr.align(x, y, join='outer')
。 - 以Python字典的形式跟踪任意元数据:
x.attrs
。
文档
在https://docs.xarray.dev/的官方文档中了解更多关于xarray的信息。
尝试使用交互式Jupyter笔记本。
贡献
您可以在我们的贡献页面找到有关为xarray做出贡献的信息。
联系方式
- 在GitHub Discussions上提问(例如:“我该如何?”)。
- 在GitHub上报告错误、建议功能或查看源代码。
- 对于定义不明确的问题或想法,或者要宣布对xarray用户感兴趣的其他项目,请使用邮件列表。
NumFOCUS
Xarray是NumFOCUS的财务赞助项目,NumFOCUS是一个非营利组织,致力于支持开源科学计算社区。如果您喜欢Xarray并希望支持我们的使命,请考虑向捐赠以支持我们的努力。
历史
Xarray 是由 Climate Corporation 开发的一款内部工具的进化。它最初由 Climate Corp 研究员 Stephan Hoyer、Alex Kleeman 和 Eugene Brevdo 编写,并于 2014 年 5 月作为开源软件发布。该项目于 2016 年 1 月从 "xray" 更名。Xarray 于 2018 年 8 月成为 NumFOCUS 的财务支持项目。
贡献者
感谢我们的众多贡献者!
许可证
版权所有 2014-2023,xarray 开发者
遵循 Apache 许可证 2.0 版(“许可证”);除非遵守许可证规定,否则不得使用此文件。您可以在以下位置获取许可证副本:
https://www.apache.org/licenses/LICENSE-2.0
除非适用法律要求或书面同意,否则在许可证下分发的软件按“原样”基础分发,不提供任何明示或暗示的保证或条件。有关许可证的具体语言,请参阅许可证。
Xarray 集成了 pandas、NumPy 和 Seaborn 的部分内容,这些内容均可在“3-clause BSD”许可下使用
- pandas:
setup.py
,xarray/util/print_versions.py
- NumPy:
xarray/core/npcompat.py
- Seaborn:
xarray/core/plot/utils.py
中的_determine_cmap_params
Xarray 还集成了 CPython 的部分内容,该内容可在 xarray/core/pycompat.py
中找到,遵循“Python 软件基金会许可证”
Xarray 使用 icomoon 包中的图标(免费版本),该图标可在“CC BY 4.0”许可下使用。
这些许可证的完整文本包含在许可证目录中。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源代码分发
构建分发
xarray-2024.9.0.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | e796a6b3eaec11da24f33e4bb14af41897011660a0516fa4037d3ae4bbd1d378 |
|
MD5 | fcc27e2ec5a502ee93faddc26eb34ebb |
|
BLAKE2b-256 | d9d3ae7a92c8448c40cd43f97fff93b1a57f87565b412fdc02eb14af5d4c3823 |
xarray-2024.9.0-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 4fd534abdf12d5fa75dd566c56483d5081f77864462cf3d6ad53e13f9db48222 |
|
MD5 | 79e76e0e501666a624c1eaf4f5b79f42 |
|
BLAKE2b-256 | 94283a6365e45721c7c9078968ed94b4a60076bc31d73b8519021a69b4995b63 |