跳转到主要内容

未提供项目描述

项目描述

嵌套pandas

Template

GitHub Workflow Status codecov Read the Docs benchmarks

一个用于有效表示嵌套关联数据集的pandas扩展。

Nested-Pandas通过工具和支持扩展了pandas包,允许将嵌套的dataframe列值打包进顶级dataframe的列中。内部使用Pyarrow以帮助扩展性和性能。

image

Nested-Pandas受时域天文学用例的启发,在这些用例中,我们通常看到两个层次的信息:关于天体对象的信息以及与这些对象关联的N个测量值。Nested-Pandas提供了一种性能高且内存高效的包,用于处理这些类型的数据集。

主要优势包括

  • 分层列访问
  • 将嵌套信息高效打包到用户自定义函数的输入中
  • 避免昂贵的groupby操作

这是一个LINCC框架项目 - 更多关于LINCC框架的信息在这里

致谢

本工程由Schmidt Sciences支持。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

nested_pandas-0.2.2.tar.gz (155.6 kB 查看哈希值)

上传时间 源代码

构建分发

nested_pandas-0.2.2-py3-none-any.whl (33.9 kB 查看哈希值)

上传时间 Python 3

支持