[NVBug 5659126] dummy inputs are kwargs maps (#676)

shengliangxu · kevalmorabia97 · commit 411912eb9b8a · 2025-12-12T00:58:31.000+05:30
## What does this PR do?

bug fix

**Overview:**

[NVBug 5659126] dummy inputs are kwargs maps, and rename the
generate_... function to more explicitly reflect the return value type


## Testing

`python diffusion_trt.py --model flux-dev --override-model-path
/models/FLUX.1-dev --torch --benchmark --skip-image
`

Signed-off-by: Shengliang Xu &lt;shengliangx@nvidia.com&gt;
diff --git a/examples/diffusers/quantization/diffusion_trt.py b/examples/diffusers/quantization/diffusion_trt.py
@@ -32,7 +32,7 @@
 
 from onnx_utils.export import (
     _create_trt_dynamic_shapes,
-    generate_dummy_inputs_and_dynamic_axes_and_shapes,
+    generate_dummy_kwargs_and_dynamic_axes_and_shapes,
     get_io_shapes,
     remove_nesting,
     update_dynamic_axes,
@@ -92,18 +92,18 @@ def benchmark_backbone_standalone(
     backbone = pipe.transformer if hasattr(pipe, "transformer") else pipe.unet
 
     # Generate dummy inputs for the backbone
-    dummy_inputs, _, _ = generate_dummy_inputs_and_dynamic_axes_and_shapes(model_name, backbone)
+    dummy_kwargs, _, _ = generate_dummy_kwargs_and_dynamic_axes_and_shapes(model_name, backbone)
 
     # Extract the dict from the tuple and move to cuda
-    dummy_inputs_dict = {
-        k: v.cuda() if isinstance(v, torch.Tensor) else v for k, v in dummy_inputs[0].items()
+    dummy_kwargs_cuda = {
+        k: v.cuda() if isinstance(v, torch.Tensor) else v for k, v in dummy_kwargs.items()
     }
 
     # Warmup
     print(f"Warming up: {num_warmup} iterations")
     for _ in tqdm(range(num_warmup), desc="Warmup"):
         with context:
-            _ = backbone(**dummy_inputs_dict)
+            _ = backbone(**dummy_kwargs_cuda)
 
     # Benchmark
     torch.cuda.synchronize()
@@ -116,7 +116,7 @@ def benchmark_backbone_standalone(
         with context:
             torch.cuda.profiler.cudart().cudaProfilerStart()
             start_event.record()
-            _ = backbone(**dummy_inputs_dict)
+            _ = backbone(**dummy_kwargs_cuda)
             end_event.record()
             torch.cuda.synchronize()
             torch.cuda.profiler.cudart().cudaProfilerStop()
@@ -241,7 +241,7 @@ def main():
     backbone.to("cuda")
 
     # Generate dummy inputs for the backbone
-    dummy_inputs, dynamic_axes, dynamic_shapes = generate_dummy_inputs_and_dynamic_axes_and_shapes(
+    dummy_inputs, dynamic_axes, dynamic_shapes = generate_dummy_kwargs_and_dynamic_axes_and_shapes(
         args.model, backbone
     )
 
diff --git a/examples/diffusers/quantization/onnx_utils/export.py b/examples/diffusers/quantization/onnx_utils/export.py
@@ -381,7 +381,7 @@ def _create_trt_dynamic_shapes(dynamic_shapes):
     }
 
 
-def generate_dummy_inputs_and_dynamic_axes_and_shapes(model_id, backbone):
+def generate_dummy_kwargs_and_dynamic_axes_and_shapes(model_id, backbone):
     """Generate dummy inputs, dynamic axes, and dynamic shapes for the given model."""
     if model_id in ["sdxl-1.0", "sdxl-turbo"]:
         dummy_kwargs, dynamic_shapes = _gen_dummy_inp_and_dyn_shapes_sdxl(
@@ -474,7 +474,7 @@ def modelopt_export_sd(backbone, onnx_dir, model_name, precision):
         configure_linear_module_onnx_quantizers(backbone) if precision == "fp4" else nullcontext()
     )
 
-    dummy_kwargs, dynamic_axes, _ = generate_dummy_inputs_and_dynamic_axes_and_shapes(
+    dummy_kwargs, dynamic_axes, _ = generate_dummy_kwargs_and_dynamic_axes_and_shapes(
         model_name, backbone
     )
 

Original file line number	Diff line number	Diff line change
`@@ -381,7 +381,7 @@ def _create_trt_dynamic_shapes(dynamic_shapes):`
`381`	`381`	`}`
`382`	`382`
`383`	`383`
`384`		`-def generate_dummy_inputs_and_dynamic_axes_and_shapes(model_id, backbone):`
	`384`	`+def generate_dummy_kwargs_and_dynamic_axes_and_shapes(model_id, backbone):`
`385`	`385`	`"""Generate dummy inputs, dynamic axes, and dynamic shapes for the given model."""`
`386`	`386`	`if model_id in ["sdxl-1.0", "sdxl-turbo"]:`
`387`	`387`	`dummy_kwargs, dynamic_shapes = _gen_dummy_inp_and_dyn_shapes_sdxl(`
`@@ -474,7 +474,7 @@ def modelopt_export_sd(backbone, onnx_dir, model_name, precision):`
`474`	`474`	`configure_linear_module_onnx_quantizers(backbone) if precision == "fp4" else nullcontext()`
`475`	`475`	`)`
`476`	`476`
`477`		`- dummy_kwargs, dynamic_axes, _ = generate_dummy_inputs_and_dynamic_axes_and_shapes(`
	`477`	`+ dummy_kwargs, dynamic_axes, _ = generate_dummy_kwargs_and_dynamic_axes_and_shapes(`
`478`	`478`	`model_name, backbone`
`479`	`479`	`)`
`480`	`480`