跳转到主要内容

具有命名轴和命名索引的NumPy数组。

项目描述

科学家、工程师、数学家和统计学家不仅处理矩阵;他们经常处理结构化数据,就像你在表中找到的那样。然而,Numpy中缺少这种功能,并且有一些努力试图创建一些来填补空白。这是其中之一。

Datarray提供了一个Numpy ndarrays的子类,支持

  • 各个维度(轴)可以用有意义的描述进行标记

  • 每个轴都有标记的刻度

  • 通过命名轴进行索引和切片

  • 可以使用刻度标签而不是仅整数来对任何轴进行索引

  • 减少操作(如.sum、.mean等)支持命名轴参数,而不仅仅是整数索引。

先例

无特定顺序

  • xray - 与本包精神非常接近,xray实现了命名的高维数组轴和刻度标签。它与(并且依赖于)Pandas集成;

  • pandas 基于一系列类似DataFrame的数据类型。

  • Tabular 实现了一种受电子表格启发的数据类型,具有行/列,csv等IO,以及复杂的表格操作。

  • scikits.statsmodels 听起来像它有一些我们希望最终在datarray等基础上实现的功能,而Skipper 似乎对这类东西也很感兴趣。

  • scikits.timeseries 还有一个针对时间序列的特定对象,这在某种程度上让人联想到标记数组。

  • pandas 基于一系列类似DataFrame的数据类型。

  • pydataframe 应该是R的data.frame的克隆。

  • larry 或“标记数组”,经常在pandas的讨论中出现。

  • divisi 包含标记稀疏数组和密集数组。

  • pymvpa 提供了一个Dataset类,封装了数据以及与前两个维度(样本和特征)长度相匹配的属性集。Dataset不是numpy数组的子类,以便允许其他数据结构(例如稀疏矩阵)。

  • ptsa 继承自ndarray,提供按维度提供的属性,旨在简化基于轴属性值的切片/索引。

项目目标

  1. 在numpy核心中获得类似的功能;

  2. 坚持基本功能,以便scikits.statsmodels等项目可以将其用作基本数据类型;

  3. 创建一个简单的、易于理解的接口,不会引起混淆;

  4. 哦,还要确保基本numpy数组仍然可用。

代码

您可以在GitHub上找到我们的源代码和一键下载;

最新发布的版本始终可以从pypi获取。

支持

请在datarray问题跟踪器上提交问题。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

datarray-0.1.0.zip (75.8 kB 查看哈希值)

上传时间 源代码

datarray-0.1.0.tar.gz (61.6 kB 查看哈希值)

上传时间 源代码

构建分发

datarray-0.1.0-py3-none-any.whl (36.8 kB 查看哈希)

上传时间 Python 3

datarray-0.1.0-py2-none-any.whl (36.8 kB 查看哈希)

上传时间 Python 2

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面