跳至主要内容

Dask并行GeoPandas

项目描述

Dask并行GeoPandas

Dask-GeoPandas 是一个将 GeoPandas 的地理空间能力和 Dask 的可扩展性相结合的项目。GeoPandas 是一个开源项目,旨在使在 Python 中处理地理空间数据更加容易。GeoPandas 扩展了 pandas 使用的数据类型,以便对几何类型进行空间操作。Dask 提供了高级并行性和分布式离核计算,并具有一个 dask.dataframe 模块,用于扩展 pandas。由于 GeoPandas 是 pandas DataFrame 的扩展,因此可以将 Dask 扩展 pandas 的方式也应用于 GeoPandas。

本项目是 Dask 和 GeoPandas 之间的桥梁,并提供了由 Dask 支持的 GeoPandas 地理空间能力。

文档

请参阅 https://dask-geopandas.readthedocs.io/en/latest/ 上的文档。

安装

此软件包依赖于 Shapely、GeoPandas 和 Dask。

安装所有必需依赖关系的一种方法是通过使用 conda 软件包管理器创建一个新的环境

conda create -n geo_env
conda activate geo_env
conda config --env --add channels conda-forge
conda config --env --set channel_priority strict
conda install dask-geopandas

示例

给定一个 GeoPandas 数据框

import geopandas
df = geopandas.read_file('...')

我们可以将其重新分区为 Dask-GeoPandas 数据框

import dask_geopandas
ddf = dask_geopandas.from_geopandas(df, npartitions=4)

GeoPandas 熟悉的空间属性和方法也可用,并将并行计算

ddf.geometry.area.compute()
ddf.within(polygon)

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于 安装软件包 的信息。

源代码分发

dask_geopandas-0.4.2.tar.gz (72.1 kB 查看哈希)

上传时间 源代码

构建分发

dask_geopandas-0.4.2-py3-none-any.whl (64.4 kB 查看哈希)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面