YARN应用程序的Python包装器
项目描述
knit 库提供了一个用于与 YARN 资源管理器交互的 Scala Python 接口。
查看 knit 的文档。
概述
knit 允许您在 YARN(Hadoop 系统中最常用的资源管理器)中使用 Python。它提供了以下高级功能入口:
CondaCreator,一种创建压缩 conda 环境的方式,以便可以将其上传到 HDFS 并提取用于在 YARN 容器中使用
YARNAPI,一个用于获取应用程序/容器状态、日志并终止运行作业的 YARN 资源管理器接口
Knit,一个 YARN 应用程序运行器,它生成一个基于 Scala 的 YARN 客户端实例,并在 YARN 上启动应用程序,然后在该应用程序中运行 YARN 容器中的命令
DaskYARNCluster,在 YARN 上启动一个 Dask 分布式集群,每个容器一个工作进程。
目标是使用从集群边缘节点进行的knit,即使用YARN配置和本地可用的CLI。
快速入门
从conda-forge安装
> conda install -c conda-forge knit
或者使用pip
> pip install knit
如果从源安装,您必须首先构建Java库(需要Java和Maven)
> python setup.py install mvn
在YARN集群上运行任意命令
import knit
k = knit.Knit()
k.start('env') # wait some time
k.logs()
在YARN上启动dask集群
import dask_yarn
cluster = dask_yarn.DaskYARNCluster()
cluster.start(nworkers=4, memory=1024, cpus=2)
项目详情
下载文件
下载您平台上的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源分布
knit-0.2.4.tar.gz (23.2 MB 查看哈希值)
构建分布
knit-0.2.4-py2.py3-none-any.whl (23.2 MB 查看哈希值)
关闭
knit-0.2.4.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | f94193d93bc785c2603c110cde98a2bb5c89b9124d6d9e9bf0cd9be680b9bbc2 |
|
MD5 | 91ed9f650125a7232b38c57b99c251af |
|
BLAKE2b-256 | a0d7304fbb4d32bc317a7b05e43685d7542df8cf3fa719e6db16f0b30b0144d0 |
关闭
knit-0.2.4-py2.py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 7555ca1750844be48ef3352a68189911a17c33aa8000f0d9355fa6fa22e27db6 |
|
MD5 | ab138a94ca1171ccbd085e994031c2aa |
|
BLAKE2b-256 | 1aab88c2cfebd4e11f8df3801ad03832062cc6f6f5ed6606b5d2962b5eacbe9b |