Skip to content

新增crun -l, --label功能 #555

@haofangTu-bot

Description

@haofangTu-bot

1、功能描述

--label 参数的核心功能是为标准输出(stdout)和标准错误(stderr)的每一行前面加上一个前缀,这个前缀是任务的编号(Task ID)。
当你运行一个并行作业时(例如,一个包含多个任务的作业步 job step),来自所有任务的输出会混合在一起。如果没有标识,你很难分辨某一行输出究竟是哪个任务产生的。--label 参数解决了这个问题。
标签格式: 标签的格式非常简单,就是任务编号后跟一个冒号和空格:任务ID: 。 例如: 0: Hello from task zero。
任务ID (Task ID): 这里的“任务ID”指的是在当前作业步(srun 命令启动的这一批任务)中的位次(rank)。它是一个从 0 开始计数的整数。如果你用 srun -n 4 ... 启动了4个任务,那么它们的任务ID将分别是 0, 1, 2, 3。这个ID与Slurm的全局作业ID(Job ID)或作业步ID(Step ID)不同。

--label 只标记输出(stdout/stderr),它不会对你需要输入的标准输入(stdin)做任何改变。

参考案例:

$ srun -n 4 --label hostname
0: slurm02
2: slurm02
1: slurm02
3: slurm03

参考文档:https://slurm.schedmd.com/srun.html
调研文档:https://e26ruh1viz.feishu.cn/wiki/OLeswxV0Zi30cXk5b7mc36xpnfd

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions