考拉 · PyPI · Python 包索引

Koalas：Apache Spark上的pandas API

这些详细信息尚未由PyPI验证

项目链接

项目描述

注意： Koalas 支持 Apache Spark 3.1 及以下版本，因为它在即将发布的 Apache Spark 3.2 中将被正式纳入 PySpark。现在此存储库处于维护模式。对于 Apache Spark 3.2 及以上版本，请直接使用 PySpark。

Apache Spark 上的 pandas API
探索 Koalas 文档 »

实时笔记本 · 问题 · 邮件列表
帮助受近期火灾影响的干渴考拉开发者

Koalas 项目通过在 Apache Spark 上实现 pandas DataFrame API，使数据科学家在与大数据交互时更加高效。

pandas 是 Python 中事实上的标准（单节点）DataFrame 实现，而 Spark 是大数据处理的事实上的标准。使用本包，您可以

如果您已经熟悉 pandas，则无需学习曲线即可立即使用 Spark。
拥有一个代码库，该代码库可以同时与 pandas（测试、小型数据集）和 Spark（分布式数据集）一起使用。

我们非常希望您尝试它，并通过我们的邮件列表或 GitHub 问题提供反馈。

您可以在实时 Jupyter 笔记本中尝试 Koalas 10 分钟教程此处。初始启动可能需要几分钟。

入门指南

Koalas 可以通过多种方式安装，例如 Conda 和 pip。

# Conda
conda install koalas -c conda-forge

# pip
pip install koalas

有关详细信息，请参阅安装。

对于 Databricks Runtime，Koalas 已预安装在 Databricks Runtime 7.1 及以上版本中。免费试用 Databricks 社区版。您还可以按照这些步骤手动在 Databricks 上安装库。

最后，如果您的 PyArrow 版本为 0.15+ 且您的 PySpark 版本低于 3.0，您最好手动将环境变量 ARROW_PRE_0_15_IPC_FORMAT 设置为 1。Koalas 会尽力为您设置它，但如果已经启动了 Spark 上下文，则无法设置。

现在您可以将 pandas DataFrame 转换为与前者 API 兼容的 Koalas DataFrame

import databricks.koalas as ks
import pandas as pd

pdf = pd.DataFrame({'x':range(3), 'y':['a','b','b'], 'z':['a','b','b']})

# Create a Koalas DataFrame from pandas DataFrame
df = ks.from_pandas(pdf)

# Rename the columns
df.columns = ['x', 'y', 'z1']

# Do some operations in place:
df['x2'] = df.x * df.x

有关详细信息，请参阅官方文档中的入门指南和依赖项。

贡献指南

请参阅官方文档中的贡献指南和设计原则。

常见问题解答

请参阅官方文档中的常见问题解答。

最佳实践

请参阅官方文档中的最佳实践。

Koalas 讲座和博客

请参阅官方文档中的 Koalas 讲座和博客。

项目详情

这些详细信息尚未由PyPI验证

项目链接

版本历史发布通知 | RSS订阅

此版本

1.8.2

2021年10月19日

1.8.1

2021年6月18日

1.8.0

2021年5月3日

1.7.0

2021年3月8日

1.6.0

2021年1月22日

1.5.0

2020年12月11日

1.4.0

2020年11月14日

1.3.0

2020年10月9日

1.2.0

2020年8月28日

1.1.0

2020年7月17日

1.0.1

2020年6月24日

1.0.0

2020年6月19日

0.33.0

2020年5月14日

0.32.0

2020年4月23日

0.31.0

2020年4月9日

0.30.0

2020年3月26日

0.29.0

2020年3月12日

0.28.0

2020年2月27日

0.27.0

2020年2月13日

0.26.0

2020年1月23日

0.25.0

2020年1月9日

0.24.0

2019年12月19日

0.23.0

2019年12月5日

0.22.0

2019年11月14日

0.21.0

2019年10月31日

0.20.0

2019年10月15日

0.19.0

2019年10月4日

0.18.0

2019年9月19日

0.17.0

2019年9月5日

0.16.0

2019年8月22日

0.15.0

2019年8月8日

0.14.0

2019年7月25日

0.13.0

2019年7月17日

0.12.0

2019年7月10日

0.11.0

2019年7月4日

0.10.0

2019年7月3日

0.9.0

2019年6月19日

0.8.0

2019年6月12日

0.7.0

2019年6月5日

0.6.0

2019年5月29日

0.5.0

2019年5月22日

0.4.1

2019年11月14日

0.4.0

2019年5月15日

0.3.0

2019年5月7日

0.2.0

2019年5月2日

0.1.0

2019年4月23日

0.0.6

2019年4月19日

下载文件

下载适合您平台的文件。如果您不确定该选择哪个，请了解更多关于安装包的信息。

源代码分发

koalas-1.8.2.tar.gz (357.8 kB 查看哈希值)

上传时间 2021年10月19日 源代码

构建分发

koalas-1.8.2-py3-none-any.whl (390.8 kB 查看哈希值)

上传时间 2021年10月19日 Python 3

koalas-1.8.2.tar.gz的哈希值

koalas-1.8.2.tar.gz的哈希值
算法	哈希摘要
SHA256	`cd072f1a9ae97e87e85e53a1c8a3097777c76f45504e79782d0acff5282fe586`
MD5	`423c3b93f51d076df668e1980987d6df`
BLAKE2b-256	`b6c481dce696d90ac382e31ded2d8ba09205f8cb4633aa0a6fbb23c8d4874047`

koalas-1.8.2-py3-none-any.whl的哈希值

koalas-1.8.2-py3-none-any.whl的哈希值
算法	哈希摘要
SHA256	`ebf00963ac604ee8763ab53ebb028bea3c7732a20cb10f4e52c9ae6a008a749f`
MD5	`8da40e5c58528a0a2c41eecd04f0c62d`
BLAKE2b-256	`289ad69cf12ea62116873b427e5843be8ae8431b18f2a0714d6f4eec3ee4cda6`

koalas 1.8.2

导航

已验证详细信息

维护者

未验证详细信息

项目链接

元信息

分类器

项目描述

入门指南

贡献指南

常见问题解答

最佳实践

Koalas 讲座和博客

项目详情

已验证详细信息

维护者

未验证详细信息

项目链接

元信息

分类器

版本历史发布通知 | RSS订阅

下载文件

源代码分发

构建分发

koalas 1.8.2

导航

已验证详细信息

维护者

未验证详细信息

项目链接

元信息

分类器

项目描述

入门指南

贡献指南

常见问题解答

最佳实践

Koalas 讲座和博客

项目详情

已验证详细信息

维护者

未验证详细信息

项目链接

元信息

分类器

版本历史 发布通知 | RSS订阅

下载文件

源代码分发

构建分发

版本历史发布通知 | RSS订阅