-
Notifications
You must be signed in to change notification settings - Fork 30
Open
Description
1、功能描述:限制了作业只能被调度到那些“每个物理核心至少拥有指定数量硬件线程”的计算节点上。
--threads-per-core=2 会要求 Slurm 必须将用户的作业分配到启用了 SMT2 或 SMT4 的节点上。如果某个节点的 CPU 关闭了超线程功能(即每个核心只有1个线程),那么这个节点就不会被选中。
-
--threads-per-core=1 则会要求作业必须运行在“每个核心只有一个线程”的节点上,或者在运行时强制不使用多线程特性,从而确保任务独占整个物理核心的计算资源。
-
当作业运行时,这个参数会告知 Slurm 的任务布局插件(task/affinity),在为用户的任务绑定CPU资源时,每个核心上最多可以使用多少个硬件线程。
2、参数格式:正整数
3、 请求的 threads 数量不能超过节点硬件的实际能力。如果用户在一个最多只有SMT2(每核2线程)的集群上请求 --threads-per-core=4,作业会被提交,但会一直处于 PENDING 状态,原因为 (ReqNodeNotAvail, NotAllReqNode),因为它永远找不到满足条件的节点。
参考来源:https://slurm.schedmd.com/sbatch.html
调研:https://e26ruh1viz.feishu.cn/wiki/NtElwkg3hiGikBkld1qcNQq7nMh
Metadata
Metadata
Assignees
Labels
No labels