跳转到主要内容

在远程系统上提交、监控和终止作业

项目描述

Troika

在本地和远程主机上提交、监控和终止作业

需求

安装

python3 -m venv troika
source troika/bin/activate
python3 -m pip install troika

运行测试

在您的环境中安装Troika后,可以使用pytest运行测试

python3 -m pytest -v tests/

构建文档

文档使用sphinx。要生成HTML文档

cd docs/
make html

演示

在FOSDEM'23上关于"Troika:使用相同的接口在任何HPC系统上提交、监控和中断作业"演讲的幻灯片和录音可通过https://fosdem.org/2023/schedule/event/troika_hpc_jobs获取。

入门

概念

Troika持有一份站点列表,可以提交作业。站点由两个主要参数定义:一个连接类型localssh),以及一个站点类型(例如directslurm)。每个站点都由配置文件中给出的名称标识。

示例配置文件

---
sites:
    localhost:
        type: direct         # jobs are run directly on the target
        connection: local    # the target is the current host
    remote:
        type: direct         # jobs are run directly on the target
        connection: ssh      # connect to the target via ssh
        host: remotebox      # ssh host
        copy_script: true    # if false, the script will be piped through ssh
        at_startup: ["check_connection"]
    slurm_cluster:
        type: slurm          # jobs are submitted to Slurm
        connection: ssh      # connect to the target via ssh
        host: remotecluster  # ssh host
        copy_script: true    # if false, the script will be piped through ssh
        at_startup: ["check_connection"]
        pre_submit: ["create_output_dir"]
        at_exit: ["copy_submit_logfile"]
    pbs_cluster:
        type: pbs            # jobs are submitted to PBS
        connection: ssh      # connect to the target via ssh
        host: othercluster   # ssh host
        copy_script: true    # if false, the script will be piped through ssh
        at_startup: ["check_connection"]
        pre_submit: ["create_output_dir"]
        at_exit: ["copy_submit_logfile"]

可以使用list-sites命令检查配置

$ troika -c config.yml list-sites
Available sites:
Name                         Type            Connection
------------------------------------------------------------
localhost                    direct          local
remote                       direct          ssh
slurm_cluster                slurm           ssh
pbs_cluster                  pbs             ssh

可用选项

$ troika --help

主要命令

cluster上提交作业

$ troika -c config.yaml submit -o /path/to/output/file cluster job.sh

查询作业状态

$ troika -c config.yaml monitor cluster job.sh

终止作业

$ troika -c config.yaml kill cluster job.sh

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

troika-0.2.3.tar.gz (32.2 kB 查看哈希值)

上传时间 源代码

构建分发

troika-0.2.3-py3-none-any.whl (44.1 kB 查看哈希值)

上传时间 Python 3

支持者