dask-expr 1.1.15
pip安装dask-expr
最新版本
发布时间:
Dask的高级表达式
导航
未验证详情
这些详情尚未由PyPI验证项目链接
元数据
- 许可证: BSD许可证 (BSD)
- 维护者: Matthew Rocklin
- 标签 dask, pandas
- 要求: Python >=3.10
分类器
- 目标受众
- 许可证
- 操作系统
- 编程语言
- 主题
项目描述
Dask表达式
Dask DataFrames具有查询优化。
这是Dask DataFrame的重新编写,包括查询优化和一般组织改进。
更多内容请查看我们的博客文章
示例
import dask_expr as dx
df = dx.datasets.timeseries()
df.head()
df.groupby("name").x.mean().compute()
查询表示
Dask-expr将用户代码编码在表达式树中
>>> df.x.mean().pprint()
Mean:
Projection: columns='x'
Timeseries: seed=1896674884
此表达式树将在执行前进行优化和修改
>>> df.x.mean().optimize().pprint()
Div:
Sum:
Fused(375f9):
| Projection: columns='x'
| Timeseries: dtypes={'x': <class 'float'>} seed=1896674884
Count:
Fused(375f9):
| Projection: columns='x'
| Timeseries: dtypes={'x': <class 'float'>} seed=1896674884
稳定性
这是自2024.3.0版本以来dask.DataFrame的默认后端。
API覆盖率
Dask-Expr涵盖了Dask DataFrame API的几乎所有内容。唯一缺少的功能是
- 命名分组聚合
项目详情
未验证详情
这些详情尚未由PyPI验证项目链接
元数据
- 许可证: BSD许可证 (BSD)
- 维护者: Matthew Rocklin
- 标签 dask, pandas
- 要求: Python >=3.10
分类器
- 目标受众
- 许可证
- 操作系统
- 编程语言
- 主题