PaddlePaddle · Bobholamovic · Jan 10, 2025 · Jan 10, 2025 · Jan 10, 2025 · Jan 10, 2025
diff --git a/paddlex/inference/components/paddle_predictor/predictor.py b/paddlex/inference/components/paddle_predictor/predictor.py
@@ -14,6 +14,7 @@
 
 import os
 from abc import abstractmethod
+from pathlib import Path
 import lazy_paddle as paddle
 import numpy as np
 
@@ -22,27 +23,50 @@
 from ...utils.pp_option import PaddlePredictorOption
 from ..base import BaseComponent
 
+CACHE_DIR = ".cache"
 
-def collect_trt_shapes(
-    model_file, model_params, gpu_id, shape_range_info_path, trt_dynamic_shapes
+
+def collect_trt_shape_range_info(
+    model_file,
+    model_params,
+    gpu_id,
+    shape_range_info_path,
+    dynamic_shapes,
+    dynamic_shape_input_data,
 ):
+    dynamic_shape_input_data = dynamic_shape_input_data or {}
+
     config = paddle.inference.Config(model_file, model_params)
     config.enable_use_gpu(100, gpu_id)
+    config.collect_shape_range_info(shape_range_info_path)
+    config.disable_glog_info()
+    predictor = paddle.inference.create_predictor(config)
+
     min_arrs, opt_arrs, max_arrs = {}, {}, {}
-    for name, candidate_shapes in trt_dynamic_shapes.items():
+    for name, candidate_shapes in dynamic_shapes.items():
         min_shape, opt_shape, max_shape = candidate_shapes
-        min_arrs[name] = np.ones(min_shape, dtype=np.float32)
-        opt_arrs[name] = np.ones(opt_shape, dtype=np.float32)
-        max_arrs[name] = np.ones(max_shape, dtype=np.float32)
+        # HACK: Currently the data type is hard-coded
+        if name in dynamic_shape_input_data:
+            min_arrs[name] = np.array(
+                dynamic_shape_input_data[name][0], dtype=np.float32
+            ).reshape(min_shape)
+            opt_arrs[name] = np.array(
+                dynamic_shape_input_data[name][1], dtype=np.float32
+            ).reshape(opt_shape)
+            max_arrs[name] = np.array(
+                dynamic_shape_input_data[name][2], dtype=np.float32
+            ).reshape(max_shape)
+        else:
+            min_arrs[name] = np.ones(min_shape, dtype=np.float32)
+            opt_arrs[name] = np.ones(opt_shape, dtype=np.float32)
+            max_arrs[name] = np.ones(max_shape, dtype=np.float32)
 
-    config.collect_shape_range_info(shape_range_info_path)
-    predictor = paddle.inference.create_predictor(config)
     # opt_arrs would be used twice to simulate the most common situations
     for arrs in [min_arrs, opt_arrs, opt_arrs, max_arrs]:
         for name, arr in arrs.items():
-            input_handler = predictor.get_input_handle(name)
-            input_handler.reshape(arr.shape)
-            input_handler.copy_from_cpu(arr)
+            handle = predictor.get_input_handle(name)
+            handle.reshape(arr.shape)
+            handle.copy_from_cpu(arr)
         predictor.run()
 
 
@@ -146,33 +170,78 @@ def _create(self):
                     "trt_fp16": Config.Precision.Half,
                 }
                 if self.option.run_mode in precision_map.keys():
+                    config.set_optim_cache_dir(str(self.model_dir / CACHE_DIR))
+
                     config.enable_tensorrt_engine(
-                        workspace_size=(1 << 25) * self.option.batch_size,
-                        max_batch_size=self.option.batch_size,
-                        min_subgraph_size=self.option.min_subgraph_size,
+                        workspace_size=self.option.trt_max_workspace_size,
+                        max_batch_size=self.option.trt_max_batch_size,
+                        min_subgraph_size=self.option.trt_min_subgraph_size,
                         precision_mode=precision_map[self.option.run_mode],
                         use_static=self.option.trt_use_static,
-                        use_calib_mode=self.option.trt_calib_mode,
+                        use_calib_mode=self.option.trt_use_calib_mode,
                     )
 
-                    if not os.path.exists(self.option.shape_info_filename):
-                        logging.info(
-                            f"Dynamic shape info is collected into: {self.option.shape_info_filename}"
-                        )
-                        collect_trt_shapes(
-                            model_file,
-                            params_file,
-                            self.option.device_id,
-                            self.option.shape_info_filename,
-                            self.option.trt_dynamic_shapes,
-                        )
-                    else:
-                        logging.info(
-                            f"A dynamic shape info file ( {self.option.shape_info_filename} ) already exists. No need to collect again."
-                        )
-                    config.enable_tuned_tensorrt_dynamic_shape(
-                        self.option.shape_info_filename, True
-                    )
+                    if self.option.trt_use_dynamic_shapes:
+                        if self.option.trt_collect_shape_range_info:
+                            # NOTE: We always use a shape range info file.
+                            if self.option.trt_shape_range_info_path is not None:
+                                trt_shape_range_info_path = Path(
+                                    self.option.trt_shape_range_info_path
+                                )
+                            else:
+                                trt_shape_range_info_path = (
+                                    self.model_dir
+                                    / CACHE_DIR
+                                    / "shape_range_info.pbtxt"
+                                )
+                            should_collect_shape_range_info = True
+                            if not trt_shape_range_info_path.exists():
+                                trt_shape_range_info_path.parent.mkdir(
+                                    parents=True, exist_ok=True
+                                )
+                                logging.info(
+                                    f"Shape range info will be collected into {trt_shape_range_info_path}"
+                                )
+                            elif self.option.trt_discard_cached_shape_range_info:
+                                trt_shape_range_info_path.unlink()
+                                logging.info(
+                                    f"The shape range info file ({trt_shape_range_info_path}) has been removed, and the shape range info will be re-collected."
+                                )
+                            else:
+                                logging.info(
+                                    f"A shape range info file ({trt_shape_range_info_path}) already exists. There is no need to collect the info again."
+                                )
+                                should_collect_shape_range_info = False
+                            if should_collect_shape_range_info:
+                                collect_trt_shape_range_info(
+                                    model_file,
+                                    params_file,
+                                    self.option.device_id,
+                                    str(trt_shape_range_info_path),
+                                    self.option.trt_dynamic_shapes,
+                                    self.option.trt_dynamic_shape_input_data,
+                                )
+                            config.enable_tuned_tensorrt_dynamic_shape(
+                                str(trt_shape_range_info_path),
+                                self.option.trt_allow_build_at_runtime,
+                            )
+                        else:
+                            if self.option.trt_dynamic_shapes is not None:
+                                min_shapes, opt_shapes, max_shapes = {}, {}, {}
+                                for (
+                                    key,
+                                    shapes,
+                                ) in self.option.trt_dynamic_shapes.items():
+                                    min_shapes[key] = shapes[0]
+                                    opt_shapes[key] = shapes[1]
+                                    max_shapes[key] = shapes[2]
+                                    config.set_trt_dynamic_shape_info(
+                                        min_shapes, max_shapes, opt_shapes
+                                    )
+                            else:
+                                raise RuntimeError(
+                                    "No dynamic shape information provided"
+                                )
 
         elif self.option.device == "npu":
             config.enable_custom_device("npu")
@@ -217,8 +286,8 @@ def _create(self):
                 if hasattr(config, "disable_mkldnn"):
                     config.disable_mkldnn()
 
-        # Disable paddle inference logging
-        config.disable_glog_info()
+        if self.option.disable_glog_info:
+            config.disable_glog_info()
 
         config.set_cpu_math_library_num_threads(self.option.cpu_threads)
 

diff --git a/paddlex/inference/models/base/basic_predictor.py b/paddlex/inference/models/base/basic_predictor.py
@@ -49,6 +49,14 @@ def __init__(self, model_dir, config=None, device=None, pp_option=None):
         )
         if trt_dynamic_shapes:
             pp_option.trt_dynamic_shapes = trt_dynamic_shapes
+        trt_dynamic_shape_input_data = (
+            self.config.get("Hpi", {})
+            .get("backend_configs", {})
+            .get("paddle_infer", {})
+            .get("trt_dynamic_shape_input_data", None)
+        )
+        if trt_dynamic_shape_input_data:
+            pp_option.trt_dynamic_shape_input_data = trt_dynamic_shape_input_data
         self.pp_option = pp_option
 
         self.components = {}

diff --git a/paddlex/inference/models_new/base/predictor/basic_predictor.py b/paddlex/inference/models_new/base/predictor/basic_predictor.py
@@ -12,8 +12,9 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-from typing import Dict, Any, Iterator
-from abc import abstractmethod
+from typing import Any, Dict, Iterator, List, Optional
+
+from pydantic import BaseModel, ValidationError
 
 from .....utils.subclass_register import AutoRegisterABCMetaClass
 from .....utils.flags import (
@@ -26,6 +27,25 @@
 from .base_predictor import BasePredictor
 
 
+class PaddleInferenceInfo(BaseModel):
+    trt_dynamic_shapes: Optional[Dict[str, List[List[int]]]] = None
+    trt_dynamic_shape_input_data: Optional[Dict[str, List[List[float]]]] = None
+
+
+class TensorRTInfo(BaseModel):
+    dynamic_shapes: Optional[Dict[str, List[List[int]]]] = None
+
+
+class InferenceBackendInfo(BaseModel):
+    paddle_infer: Optional[PaddleInferenceInfo] = None
+    tensorrt: Optional[TensorRTInfo] = None
+
+
+# Does using `TypedDict` make things more convenient?
+class HPIInfo(BaseModel):
+    backend_configs: Optional[InferenceBackendInfo] = None
+
+
 class BasicPredictor(
     BasePredictor,
     metaclass=AutoRegisterABCMetaClass,
@@ -37,32 +57,21 @@ class BasicPredictor(
     def __init__(
         self,
         model_dir: str,
-        config: Dict[str, Any] = None,
-        device: str = None,
-        pp_option: PaddlePredictorOption = None,
+        config: Optional[Dict[str, Any]] = None,
+        *,
+        device: Optional[str] = None,
+        pp_option: Optional[PaddlePredictorOption] = None,
     ) -> None:
         """Initializes the BasicPredictor.
 
         Args:
             model_dir (str): The directory where the model files are stored.
-            config (Dict[str, Any], optional): The configuration dictionary. Defaults to None.
+            config (Dict[str, Any], optional): The model configuration dictionary. Defaults to None.
             device (str, optional): The device to run the inference engine on. Defaults to None.
             pp_option (PaddlePredictorOption, optional): The inference engine options. Defaults to None.
         """
         super().__init__(model_dir=model_dir, config=config)
-        if not pp_option:
-            pp_option = PaddlePredictorOption(model_name=self.model_name)
-        if device:
-            pp_option.device = device
-        trt_dynamic_shapes = (
-            self.config.get("Hpi", {})
-            .get("backend_configs", {})
-            .get("paddle_infer", {})
-            .get("trt_dynamic_shapes", None)
-        )
-        if trt_dynamic_shapes:
-            pp_option.trt_dynamic_shapes = trt_dynamic_shapes
-        self.pp_option = pp_option
+        self.pp_option = self._prepare_pp_option(pp_option, device)
 
         logging.debug(f"{self.__class__.__name__}: {self.model_dir}")
         self.benchmark = benchmark
@@ -128,8 +137,46 @@ def set_predictor(
         """
         if batch_size:
             self.batch_sampler.batch_size = batch_size
-            self.pp_option.batch_size = batch_size
+            self.pp_option.trt_max_batch_size = batch_size
         if device and device != self.pp_option.device:
             self.pp_option.device = device
         if pp_option and pp_option != self.pp_option:
             self.pp_option = pp_option
+
+    def get_hpi_info(self) -> Optional[HPIInfo]:
+        if "Hpi" not in self.config:
+            return None
+        try:
+            return HPIInfo.model_validate(self.config["Hpi"])
+        except ValidationError as e:
+            logging.exception("The HPI info in the model config file is invalid.")
+            raise RuntimeError(f"Invalid HPI info: {str(e)}") from e
+
+    def _prepare_pp_option(
+        self,
+        pp_option: Optional[PaddlePredictorOption] = None,
+        device: Optional[str] = None,
+    ) -> PaddlePredictorOption:
+        if not pp_option:
+            pp_option = PaddlePredictorOption(model_name=self.model_name)
+        if device:
+            pp_option.device = device
+        hpi_info = self.get_hpi_info()
+        if hpi_info is not None:
+            logging.debug("HPI info: %s", hpi_info)
+            hpi_info = hpi_info.model_dump(exclude_unset=True)
+            trt_dynamic_shapes = (
+                hpi_info.get("backend_configs", {})
+                .get("paddle_infer", {})
+                .get("trt_dynamic_shapes", None)
+            )
+            if trt_dynamic_shapes:
+                pp_option.trt_dynamic_shapes = trt_dynamic_shapes
+            trt_dynamic_shape_input_data = (
+                hpi_info.get("backend_configs", {})
+                .get("paddle_infer", {})
+                .get("trt_dynamic_shape_input_data", None)
+            )
+            if trt_dynamic_shape_input_data:
+                pp_option.trt_dynamic_shape_input_data = trt_dynamic_shape_input_data
+        return pp_option