-
Notifications
You must be signed in to change notification settings - Fork 30
Open
Description
1、功能描述
--label 参数的核心功能是为标准输出(stdout)和标准错误(stderr)的每一行前面加上一个前缀,这个前缀是任务的编号(Task ID)。
当你运行一个并行作业时(例如,一个包含多个任务的作业步 job step),来自所有任务的输出会混合在一起。如果没有标识,你很难分辨某一行输出究竟是哪个任务产生的。--label 参数解决了这个问题。
标签格式: 标签的格式非常简单,就是任务编号后跟一个冒号和空格:任务ID: 。 例如: 0: Hello from task zero。
任务ID (Task ID): 这里的“任务ID”指的是在当前作业步(srun 命令启动的这一批任务)中的位次(rank)。它是一个从 0 开始计数的整数。如果你用 srun -n 4 ... 启动了4个任务,那么它们的任务ID将分别是 0, 1, 2, 3。这个ID与Slurm的全局作业ID(Job ID)或作业步ID(Step ID)不同。
--label 只标记输出(stdout/stderr),它不会对你需要输入的标准输入(stdin)做任何改变。
参考案例:
$ srun -n 4 --label hostname
0: slurm02
2: slurm02
1: slurm02
3: slurm03
参考文档:https://slurm.schedmd.com/srun.html
调研文档:https://e26ruh1viz.feishu.cn/wiki/OLeswxV0Zi30cXk5b7mc36xpnfd
Metadata
Metadata
Assignees
Labels
No labels