未提供项目描述
项目描述
dask-databricks
在Databricks多节点集群上运行Dask的集群工具。
快速入门
要在Databricks上启动Dask集群,您需要创建一个包含以下内容的初始化脚本,并配置您的多节点集群使用它。
#!/bin/bash
# Install Dask + Dask Databricks
/databricks/python/bin/pip install --upgrade dask[complete] dask-databricks
# Start Dask cluster components
dask databricks run
然后,您可以从Databricks笔记本中快速连接Dask Client
到在Spark驱动节点上运行的调度器。
import dask_databricks
client = dask_databricks.get_client()
现在,您可以从笔记本提交工作到多节点Dask集群。
def inc(x):
return x + 1
x = client.submit(inc, 10)
x.result()
仪表板
您可以通过Databricks驱动节点代理访问Dask仪表板。链接可以在Client
或DatabricksCluster
repr中找到,或者通过client.dashboard_link
。
>>> print(client.dashboard_link)
https://dbc-dp-xxxx.cloud.databricks.com/driver-proxy/o/xxxx/xx-xxx-xxxx/8087/status
发布
此项目的发布是使用GitHub Actions和pypa/gh-action-pypi-publish
操作自动化的。
要创建一个新版本,将一个标签推送到格式为x.x.x
的上游仓库。软件包将自动构建并推送到PyPI,然后稍后由conda-forge获取。
# Make sure you have an upstream remote
git remote add upstream git@github.com:dask-contrib/dask-databricks.git
# Create a tag and push it upstream
git tag x.x.x && git push upstream main --tags
项目详情
关闭
dask_databricks-0.3.2.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 09dc89dbb472270ab5491891f65199a4a258d9e6214e7bfb8243077aa71515bc |
|
MD5 | 2d4ef22f462ac775a4facb79130c3862 |
|
BLAKE2b-256 | 269352bed2f5a9f5c32abef821af49984d919e8a6b094d9562c91c99ab88baa2 |
关闭
dask_databricks-0.3.2-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 37c3102917c9bd2da22204e66f9d8bec9ef3b79052e9e91f86d6e6d35bee3a9d |
|
MD5 | c2cec7445bed4d35969215bb7c5c6c25 |
|
BLAKE2b-256 | 11c338bd87b8451545e29bec360678dbf280ebbb4cc9685323688d48085eaf5a |