Flux模块,用于启用可突发插件。
项目描述
Flux Burst
这是一个用于协调Flux突发的Python模块。🧋️
插件
当前和期望的插件包括
- flux-burst-local 在本地HPC系统上“突起”
- flux-burst-gke 突发到Google Kubernetes Engine
- flux-burst-eks 突发到Amazon EKS
- flux-burst-compute-engine 突发到Google Cloud Compute Engine
问题
- 插件(或客户端)应该如何管理检查何时创建/销毁集群?
- 我们能否有更好的命名空间不同突发的策略(例如,超出burst-0,burst-1,...,burst-N)
- 如果插件在设置/配置中失败,我们需要一个合理的默认操作
- 每个插件应该如何决定集群的大小?目前我只是取作业的最大大小,我们假设作业需要相同的节点类型。
- 我们最终将希望有用地使用命名空间(例如,用户)
- 我们最终希望为某个工作指定一个特定的爆发,以便能够更详细地自定义,例如命名空间或其他来自工作规范的属性(目前它们对插件是全局的)
- 谁控制清理?这可以通过flux-burst全局控制器或插件来完成,无论是自动的还是手动的。
- 所有插件都应该支持读取YAML参数(一些爆发规范)
- 所有插件都应该能够将资源请求与实例类型等匹配
- 插件“本地队列”(self.jobs)应该假设与一个爆发相关联,其中大小是最大作业大小吗?
- 我们应该根据提供的名称+大小推导出名称,以便集群在名称和大小上都是唯一的吗?
😁️贡献者😁️
我们使用all-contributors工具生成下面的贡献者图形。
Vanessasaurus 💻 |
许可证
HPCIC DevTools在MIT许可条款下分发。所有新的贡献都必须在此许可下进行。
有关详细信息,请参阅LICENSE、COPYRIGHT和NOTICE。
SPDX-License-Identifier: (MIT)
LLNL-CODE- 842614
项目详情
关闭
flux-burst-0.0.15.tar.gz的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 6b7cf82c32efaf7cb10ad6d14f3837669c0e5cac36228eaf8f31aa9d8fb8a4b2 |
|
MD5 | d8ef11c8259f759dc18e7de49b2c442f |
|
BLAKE2b-256 | d20eb997d6bacc6007543abf00eff16504d83547263ff0876eaf695ce09bb90b |