REANA - 可重复使用的分析
项目描述
关于
REANA是一个可重复和可重现的研究数据分析平台。它帮助研究人员以可重复的方式构建其输入数据、分析代码、容器化环境和计算工作流程,以便在远程计算云上实例化和运行分析。
REANA旨在针对粒子物理分析的使用案例,但适用于任何科学学科。该系统为在原始出版物后几年内重用和重新解释保留的分析铺平了道路。
功能
以可重复的方式构建研究数据分析
在远程云上实例化计算工作流程
使用修改后的输入数据、参数或代码重新运行分析
支持多个计算云(Kubernetes/OpenStack)
支持多个工作流程规范(CWL、串行、Yadage)
支持多个共享存储系统(Ceph)
支持多种容器技术(Docker)
有用链接
更改
版本0.6.1(2020-06-09)
- 管理员
通过固定几个依赖关系来解决REANA 0.6.x版本系列的安装问题。
升级REANA-Commons包到最新的Kubernetes Python客户端版本。
修改 minikube start 的文档,明确包含 VirtualBox 虚拟机管理程序。
版本 0.6.0(2019-12-27)
- 用户
为所有工作流程引擎(CWL、串行、Yadage)添加了对 HTCondor 计算后端的支持。
为所有工作流程引擎(CWL、串行、Yadage)添加了对 Slurm 计算后端的支持。
允许运行混合分析管道,其中工作流程的不同部分可以在不同的计算后端(HTCondor、Kubernetes、Slurm)上运行。
为用户工作流程添加了对 Kerberos 认证机制的支持。
引入了用户密钥管理命令 secrets-add、secrets-list 和 secrets-delete。
修复了 upload 命令的行为,以便上传非常大的文件。
将 CWL 工作流程引擎升级到 1.0.20191022103248。
将 Yadage 工作流程引擎升级到 0.20.0,并使用 Packtivity 0.14.21。
添加了对 Python 3.8 的支持。
请参阅 reana-client 0.6.0 版本发布说明 中的其他更改。
- 管理员
升级到 Kubernetes 1.16,并将 Traefik 安装移动到 Helm 3.0.0。
为 REANA 创建了一个新的 Kubernetes 服务帐户,并授予适当的权限。
使数据库连接详情可配置,以便 REANA 可以连接到集群外部的数据库。
如果管理员在集群创建时未提供,自动生成部署密钥。
在集群初始化时添加交互模式,允许提供部署密钥。
添加 CERN 特定的 Kerberos 配置文件和 CERN EOS 存储支持。
请参阅 reana-cluster 0.6.0 版本发布说明 中的其他更改。
- 开发者
修改了批量工作流程运行时 pod 创建,包括一个与工作流程引擎一起运行的作业控制器实例,使用 sidecar 模式。
添加了通用的作业管理类,并为 CERN HTCondor 和 CERN Slurm 集群提供了示例类。
将用户密钥提供给作业容器运行时任务。
如果需要 Kerberos 认证,则将 sidecar 容器添加到 Kubernetes 作业 pod 中。
使用单例模式重构了作业监控。
为面向开发者的安装丰富了 make 行为,包括实时代码重新加载更改和调试。
为开发者丰富了 git-status 组件状态报告。
请参阅 REANA 0.6.0 平台各个组件 中的其他更改。
版本 0.5.0(2019-04-24)
- 用户
允许通过在工作空间文件上运行交互式 Jupyter 笔记本会议来探索工作流程结果。
允许声明工作流程运行所需的计算资源,例如访问 CVMFS 存储库。
改进了 reana-client 命令行客户端,并添加了停止工作流程、比较工作流程、移动和删除文件的新选项。
将 CWL 引擎升级到 1.0.20181118133959。
请参阅 reana-client 0.5.0 版本发布说明 中的其他更改。
- 管理员
升级到 Kubernetes 1.14、Helm 2.13 和 Minikube 1.0。
将集群基础设施 pod 与工作流程控制器将创建的运行时工作流程引擎 pod 分离。
引入了可配置的 CVMFS 和 CephFS 共享卷挂载。
添加了对可选 HTTPS 协议终止的支持。
引入了传入工作流程队列,以提高在用户风暴情况下的额外安全性。
使基础设施 pod 的容器镜像更瘦,以减少内存占用。
请参阅 reana-cluster 0.5.0 版本发布说明 中的其他更改。
- 开发者
通过使用类似于 git-submodule 的行为来增强共享组件的开发过程。
引入了简单的 Makefile,用于(快速)本地测试和(慢速)夜间构建。
集中管理日志级别和常见 Celery 任务。
添加了测试套件固定值辅助程序,并提高了代码覆盖率。
请参阅 REANA 0.5.0 平台各个组件 中的其他更改。
版本 0.4.0 (2018-11-07)
使用常见的 OpenAPI 客户端进行工作流引擎与作业控制器之间的通信。
改进了 AMQP 重新连接处理。
增强测试套件并提高代码覆盖率。
更改许可证为 MIT。
版本 0.3.0 (2018-09-27)
引入新的串行工作流引擎,用于简单的顺序工作流需求。
增强 CWL、串行和 Yadage 工作流引擎的进度报告。
简化 reana-client 命令集和使用场景。
引入了多用户功能,使用强制访问令牌。
添加了对使用共享 CephFS 卷的多节点集群的支持。
添加了对 Kubernetes 1.11、Minikube 0.28.2 的支持。
将 CWL 工作流引擎升级到最新的 cwltool 版本。
修复了多个问题,例如使用 Python 3 下载二进制文件。
版本 0.2.0 (2018-04-23)
添加了对 Common Workflow Language 工作流的支持。
添加了对持久化用户选择的工作流名称的支持。
启用使用绝对路径上传文件和目录输入。
丰富 reana-client 和 reana-cluster 命令集。
降低命令的冗余级别并改进错误信息。
版本 0.1.0 (2018-01-30)
首次公开发布。
项目详情
reana-0.6.1.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 0c95e499ead5d2cf95966f8854300278b3397c6042247d021ac400bdd10a8fe0 |
|
MD5 | bc33550bbd639b419c574a0c3f7d43ad |
|
BLAKE2b-256 | be656b45b52c89e2d92b899eb4470e69535def5ea9faaf67ad6a2fe3e3842f87 |