跳转到主要内容

使用Apache Spark的Delta Lake的Python API

项目描述

Delta Lake

Delta Lake 是一个开源存储层,它为数据湖带来了可靠性。Delta Lake提供ACID事务、可扩展的元数据处理,并统一了流式和批量数据处理。Delta Lake在您的现有数据湖之上运行,并与Apache Spark API完全兼容。

此PyPi包包含用于使用Apache Spark与Delta Lake一起使用的Python API。

安装和用法

  1. 使用 pip install delta-spark 安装
  2. 要使用Apache Spark与Delta Lake一起使用,您在创建SparkSession时必须设置额外的配置。有关详细信息,请参阅在线 项目网页

文档

此README文件仅包含与pip安装的Delta Lake相关的基本信息。您可以在 项目网页 上找到完整文档。

项目详情


下载文件

下载适合您的平台的文件。如果您不确定要选择哪个,请了解更多关于 安装包 的信息。

源分发

delta_spark-3.2.1.tar.gz (22.1 kB 查看哈希值)

上传时间

构建分发

delta_spark-3.2.1-py3-none-any.whl (21.2 kB 查看哈希值)

上传时间 Python 3

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面