使用Apache Spark的Delta Lake的Python API
项目描述
Delta Lake
Delta Lake 是一个开源存储层,它为数据湖带来了可靠性。Delta Lake提供ACID事务、可扩展的元数据处理,并统一了流式和批量数据处理。Delta Lake在您的现有数据湖之上运行,并与Apache Spark API完全兼容。
此PyPi包包含用于使用Apache Spark与Delta Lake一起使用的Python API。
安装和用法
- 使用
pip install delta-spark
安装 - 要使用Apache Spark与Delta Lake一起使用,您在创建SparkSession时必须设置额外的配置。有关详细信息,请参阅在线 项目网页。
文档
此README文件仅包含与pip安装的Delta Lake相关的基本信息。您可以在 项目网页 上找到完整文档。
项目详情
下载文件
下载适合您的平台的文件。如果您不确定要选择哪个,请了解更多关于 安装包 的信息。
源分发
delta_spark-3.2.1.tar.gz (22.1 kB 查看哈希值)
构建分发
delta_spark-3.2.1-py3-none-any.whl (21.2 kB 查看哈希值)
关闭
delta_spark-3.2.1.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 05384ebfeee8e779435302a3e0f1e565636270a2404bedc3a2ee1fea7c980626 |
|
MD5 | 2d0ee12a0f64b756250e541a2558f349 |
|
BLAKE2b-256 | 176ea940d14a764fea1dba5e131e041351a99bc26974f73a6ac19b143598bb34 |