跳转到主要内容

基于网格聚合的数据可视化工具链

项目描述



将即使是最大的数据也转换成精确的图像

下载 https://pypistats.org/packages/datashader https://anaconda.org/pyviz/datashader
构建状态 Build Status
覆盖率 codecov
最新开发版本 Github tag dev-site
最新版本 Github release PyPI version datashader version conda-forge version defaults version
Python Python support
文档 DocBuildStatus site
支持 Discourse

History of OS GIS Timeline


这是什么?

数据处理器(Datashader)是一个数据光栅化管道,用于自动化创建大量数据的有意义表示的过程。数据处理器将数据的图像创建过程分为3个主要步骤:

  1. 投影

    每个记录根据指定的符号投影到零个或多个名义绘图网格形状的桶中。

  2. 聚合

    为每个桶计算缩减,将可能的大型数据集压缩到一个更小的聚合数组中。

  3. 转换

    然后进一步处理这些聚合,最终创建一个图像。

使用这个非常通用的管道,可以以高性能和可扩展的方式创建许多有趣的数据可视化。数据处理器包含创建这些管道的工具,使用几行代码以可组合的方式轻松创建。数据处理器可以单独使用,但它也设计为作为绘图库的预处理阶段,使该库能够处理比通常更大的数据集。

安装

数据处理器支持Linux、Windows或Mac上的Python 3.9、3.10、3.11和3.12,并且可以使用conda安装

conda install datashader

或使用pip

pip install datashader

为了获得最佳性能,我们建议使用conda,以确保您获得针对您的平台优化的数值库。最新版本可在pyviz通道conda install -c pyviz datashader上找到,最新预发布版本可在dev标记的通道conda install -c pyviz/label/dev datashader上找到。

获取示例

一旦您按上述方式安装了数据处理器,您就可以获取示例

datashader examples
cd datashader-examples

这将在名为datashader-examples的新目录中创建一个新目录,其中包含运行示例所需的所有数据。

要运行所有示例,您可能需要一些额外的依赖项。如果您在conda环境中安装了数据处理器,并且该环境处于活动状态,请运行以下命令

conda env update --file environment.yml

否则创建一个新的环境

conda env create --name datashader --file environment.yml
conda activate datashader

开发人员说明

  1. 如果您系统上还没有,请安装Python 3 minicondaanaconda

  2. 如果您还没有,请克隆数据处理器git存储库

    git clone git://github.com/holoviz/datashader.git
    
  3. 设置一个新的conda环境,其中包含运行示例所需的全部依赖项

    cd datashader
    conda env create --name datashader --file ./examples/environment.yml
    conda activate datashader
    
  4. 将数据处理器目录放入此环境中的Python路径

    pip install --no-deps -e .
    

学习更多

在处理示例之后,您可以在数据处理器文档中找到附加资源,包括API文档以及关于该方法的论文和演讲。

一些示例

USA census

NYC races

NYC taxi

支持者