Hope support tensor parallel #1249

Arcmoon-Hu · 2025-03-13T06:29:10Z

The default parallel mode of Transformers is pipeline parallelism, which is obviously slower than tensor parallelism. As far as I know, transformers currently support tensor parallelism, so I hope this framework can also support tensor parallelism to make quantization faster.
Thanks！

brian-dellabetta · 2025-03-17T14:59:02Z

Hi @Arcmoon-Hu , as far as I know tensor parallelism is only a concern at inference and is supported in vllm -- see docs here -- but it is not generally used/needed during compression.

Arcmoon-Hu added the enhancement New feature or request label Mar 13, 2025

brian-dellabetta self-assigned this Mar 17, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Hope support tensor parallel #1249

Hope support tensor parallel #1249

Arcmoon-Hu commented Mar 13, 2025

brian-dellabetta commented Mar 17, 2025

Hope support tensor parallel #1249

Hope support tensor parallel #1249

Comments

Arcmoon-Hu commented Mar 13, 2025

brian-dellabetta commented Mar 17, 2025