Apache Spark Python API

这些详情未被PyPI验证

项目链接

首页

项目描述

Apache Spark

Spark是一个用于大规模数据处理的一体化分析引擎。它提供了Scala、Java、Python和R的高级API，以及一个支持数据分析通用计算图的优化引擎。它还支持包括Spark SQL（用于SQL和DataFrame）、Spark上的pandas API（用于pandas工作负载）、MLlib（用于机器学习）、GraphX（用于图处理）和Structured Streaming（用于流处理）在内的丰富的高级工具集。

https://spark.apache.ac.cn/

在线文档

您可以在项目网页上找到最新的Spark文档，包括编程指南。

Python打包

此README文件仅包含与pip安装的PySpark相关的基本信息。此打包目前处于实验性阶段，未来版本可能发生变化（尽管我们将尽力保持兼容性）。使用PySpark需要Spark JAR文件，如果您是从源代码构建，请参阅"Building Spark"中的构建说明。

Spark的Python打包并不是为了替代所有其他用例。此Spark Python打包版本适用于与现有集群（无论是Spark独立集群、YARN还是Mesos）交互 - 但不包含设置您自己的独立Spark集群所需的工具。您可以从Apache Spark下载页面下载Spark的完整版本。

注意：如果您与Spark独立集群一起使用此版本，必须确保版本（包括次要版本）匹配，否则您可能会遇到奇特的错误。

Python要求

PySpark的核心依赖于Py4J，但某些子包有其自己的额外要求，以支持某些功能（包括numpy、pandas和pyarrow）。有关生产环境的依赖项，请参阅依赖项，以及开发环境的dev/requirements.txt。

项目详情

这些详情未被PyPI验证

项目链接

首页

发布历史发布通知 | RSS源

4.0.0.dev2 预发布

2024年9月27日

4.0.0.dev1 预发布

2024年6月3日

此版本

3.5.3

2024年9月24日

3.5.2

2024年8月12日

3.5.1

2024年2月26日

3.5.0

2023年9月26日

3.4.3

2024年4月18日

3.4.2

2023年11月30日

3.4.1

2023年6月23日

3.4.0

2023年4月13日

3.3.4

2023年12月16日

3.3.3

2023年8月21日

3.3.2

2023年2月15日

3.3.1

2022年10月25日

3.3.0

2022年6月15日

3.2.4

2023年4月13日

3.2.3

2022年11月28日

3.2.2

2022年7月15日

3.2.1

2022年1月26日

3.2.0

2021年10月18日

3.1.3

2022年2月18日

3.1.2

2021年5月27日

3.1.1

2021年3月2日

3.0.3

2021年6月23日

3.0.2

2021年2月19日

3.0.1

2020年9月7日

3.0.0

2020年6月16日

2.4.8

2021年5月15日

2.4.7

2020年9月12日

2.4.6

2020年6月6日

2.4.5

2020年2月6日

2.4.4

2019年8月31日

2.4.3

2019年5月7日

2.4.2

2019年4月24日

2.4.1

2019年4月1日

2.4.0

2018年11月5日

2.3.4

2019年9月9日

2.3.3

2019年2月15日

2.3.2

2018年9月25日

2.3.1

2018年6月8日

2.3.0

2018年2月28日

2.2.3

2019年1月13日

2.2.2

2018年7月3日

2.2.1

2018年1月6日

2.2.0

2017年7月12日

2.1.3

2018年6月29日

2.1.2

2017年10月25日

2.1.1

2017年5月6日

下载文件

下载适用于您平台的文件。如果您不确定选择哪个，请了解更多关于安装软件包的信息。

源代码分发

pyspark-3.5.3.tar.gz (317.3 MB 查看哈希值)

上传于 2024年9月24日 来源

哈希对 pyspark-3.5.3.tar.gz

哈希对 pyspark-3.5.3.tar.gz
算法	哈希摘要
SHA256	`68b7cc0c0c570a7d8644f49f40d2da8709b01d30c9126cc8cf93b4f84f3d9747`
MD5	`644346ca330792c47ea4489e16fd3287`
BLAKE2b-256	`9a90cb80c8cf194958ab9a3242851c62fa5aef1a0b42f2d9642f1e2eca098005`

PySpark 3.5.3

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

Apache Spark

在线文档

Python打包

Python要求

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史发布通知 | RSS源

下载文件

源代码分发

PySpark 3.5.3

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

Apache Spark

在线文档

Python打包

Python要求

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS源

下载文件

源代码分发

发布历史发布通知 | RSS源