跳转到主要内容

未提供项目描述

项目描述

dask-databricks

在Databricks多节点集群上运行Dask的集群工具。

快速入门

要在Databricks上启动Dask集群,您需要创建一个包含以下内容的初始化脚本,并配置您的多节点集群使用它。

#!/bin/bash

# Install Dask + Dask Databricks
/databricks/python/bin/pip install --upgrade dask[complete] dask-databricks

# Start Dask cluster components
dask databricks run

然后,您可以从Databricks笔记本中快速连接Dask Client 到在Spark驱动节点上运行的调度器。

import dask_databricks

client = dask_databricks.get_client()

现在,您可以从笔记本提交工作到多节点Dask集群。

def inc(x):
    return x + 1

x = client.submit(inc, 10)
x.result()

仪表板

您可以通过Databricks驱动节点代理访问Dask仪表板。链接可以在ClientDatabricksCluster repr中找到,或者通过client.dashboard_link

>>> print(client.dashboard_link)
https://dbc-dp-xxxx.cloud.databricks.com/driver-proxy/o/xxxx/xx-xxx-xxxx/8087/status

发布

此项目的发布是使用GitHub Actions和pypa/gh-action-pypi-publish操作自动化的。

要创建一个新版本,将一个标签推送到格式为x.x.x的上游仓库。软件包将自动构建并推送到PyPI,然后稍后由conda-forge获取。

# Make sure you have an upstream remote
git remote add upstream git@github.com:dask-contrib/dask-databricks.git

# Create a tag and push it upstream
git tag x.x.x && git push upstream main --tags

项目详情


下载文件

下载您平台所需的文件。如果您不确定选择哪一个,请了解更多关于安装包的信息。

源代码分发

dask_databricks-0.3.2.tar.gz (8.9 kB 查看哈希值)

上传时间 源代码

构建分发

dask_databricks-0.3.2-py3-none-any.whl (7.7 kB 查看哈希值)

上传时间 Python 3

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面