Dask并行GeoPandas
项目描述
Dask并行GeoPandas
Dask-GeoPandas 是一个将 GeoPandas 的地理空间能力和 Dask 的可扩展性相结合的项目。GeoPandas 是一个开源项目,旨在使在 Python 中处理地理空间数据更加容易。GeoPandas 扩展了 pandas 使用的数据类型,以便对几何类型进行空间操作。Dask 提供了高级并行性和分布式离核计算,并具有一个 dask.dataframe 模块,用于扩展 pandas。由于 GeoPandas 是 pandas DataFrame 的扩展,因此可以将 Dask 扩展 pandas 的方式也应用于 GeoPandas。
本项目是 Dask 和 GeoPandas 之间的桥梁,并提供了由 Dask 支持的 GeoPandas 地理空间能力。
文档
安装
此软件包依赖于 Shapely、GeoPandas 和 Dask。
安装所有必需依赖关系的一种方法是通过使用 conda 软件包管理器创建一个新的环境
conda create -n geo_env conda activate geo_env conda config --env --add channels conda-forge conda config --env --set channel_priority strict conda install dask-geopandas
示例
给定一个 GeoPandas 数据框
import geopandas
df = geopandas.read_file('...')
我们可以将其重新分区为 Dask-GeoPandas 数据框
import dask_geopandas
ddf = dask_geopandas.from_geopandas(df, npartitions=4)
GeoPandas 熟悉的空间属性和方法也可用,并将并行计算
ddf.geometry.area.compute()
ddf.within(polygon)
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于 安装软件包 的信息。
源代码分发
dask_geopandas-0.4.2.tar.gz (72.1 kB 查看哈希)
构建分发
dask_geopandas-0.4.2-py3-none-any.whl (64.4 kB 查看哈希)