minor fix to nemo1 sequence packing script (#12486)

ashors1 · web-flow · commit ceba38f5c5a8 · 2025-03-06T08:57:36.000-08:00
Signed-off-by: ashors1 &lt;ashors@nvidia.com&gt;
diff --git a/scripts/nlp_language_modeling/prepare_packed_ft_dataset.py b/scripts/nlp_language_modeling/prepare_packed_ft_dataset.py
@@ -205,7 +205,7 @@ def main(cfg: 'DictConfig') -> None:
     dataset, tokenizer = tokenize_dataset(cfg)
     sequences, histogram = create_hist(dataset, cfg.model.data.train_ds.max_seq_length)
     for pack_size in args.pack_sizes:
-        assignments = create_packing_strategy(histogram, pack_size, args.packing_algorithm)
+        assignments, _ = create_packing_strategy(histogram, pack_size, args.packing_algorithm)
         output_data = fill_packing_strategy(assignments, sequences, pack_size, tokenizer.eos_id)
 
         # save output data