feat: GenAI SDK client - Enabling Few-shot Prompt Optimization by passing either "OPTIMIZATION_TARGET_FEW_SHOT_RUBRICS" or "OPTIMIZATION_TARGET_FEW_SHOT_TARGET_RESPONSE" to the optimize method

vertex-sdk-bot · copybara-github · commit 0e7fda3243d0 · 2025-11-24T19:50:23.000-08:00
together with example dataframe

PiperOrigin-RevId: 834333590
diff --git a/tests/unit/vertexai/genai/replays/test_prompt_optimizer_async_optimize_prompt_return_type.py b/tests/unit/vertexai/genai/replays/test_prompt_optimizer_async_optimize_prompt_return_type.py
@@ -16,6 +16,7 @@
 
 from tests.unit.vertexai.genai.replays import pytest_helper
 from vertexai._genai import types
+import pandas as pd
 import pytest
 
 
@@ -32,6 +33,65 @@ async def test_optimize_prompt(client):
     assert response.raw_text_response
 
 
+@pytest.mark.asyncio
+async def test_optimize_prompt_w_optimization_target(client):
+    """Tests the optimize request parameters method with optimization target."""
+    test_prompt = "Generate system instructions for analyzing medical articles"
+    response = await client.aio.prompt_optimizer.optimize_prompt(
+        prompt=test_prompt,
+        config=types.OptimizeConfig(
+            optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_GEMINI_NANO,
+        ),
+    )
+    assert isinstance(response, types.OptimizeResponse)
+    assert response.raw_text_response
+
+
+@pytest.mark.asyncio
+async def test_optimize_prompt_w_few_shot_optimization_target(client):
+    """Tests the optimize request parameters method with few shot optimization target."""
+    test_prompt = "Generate system instructions for analyzing medical articles"
+    df = pd.DataFrame(
+        {
+            "prompt": ["prompt1", "prompt2"],
+            "model_response": ["response1", "response2"],
+            "target_response": ["target1", "target2"],
+        }
+    )
+    response = await client.aio.prompt_optimizer.optimize_prompt(
+        prompt=test_prompt,
+        config=types.OptimizeConfig(
+            optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_FEW_SHOT_TARGET_RESPONSE,
+            examples_dataframe=df,
+        ),
+    )
+    assert isinstance(response, types.OptimizeResponse)
+    assert response.raw_text_response
+
+
+@pytest.mark.asyncio
+async def test_optimize_prompt_w_few_shot_optimization_rubrics(client):
+    """Tests the optimize request parameters method with few shot optimization target."""
+    test_prompt = "Generate system instructions for analyzing medical articles"
+    df = pd.DataFrame(
+        {
+            "prompt": ["prompt1", "prompt2"],
+            "model_response": ["response1", "response2"],
+            "rubrics": ["rubric1", "rubric2"],
+            "rubrics_evals": ["[True, True]", "[True, False]"],
+        }
+    )
+    response = await client.aio.prompt_optimizer.optimize_prompt(
+        prompt=test_prompt,
+        config=types.OptimizeConfig(
+            optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_FEW_SHOT_RUBRICS,
+            examples_dataframe=df,
+        ),
+    )
+    assert isinstance(response, types.OptimizeResponse)
+    assert response.raw_text_response
+
+
 pytestmark = pytest_helper.setup(
     file=__file__,
     globals_for_file=globals(),
diff --git a/tests/unit/vertexai/genai/replays/test_prompt_optimizer_optimize_prompt_return_type.py b/tests/unit/vertexai/genai/replays/test_prompt_optimizer_optimize_prompt_return_type.py
@@ -16,6 +16,7 @@
 
 from tests.unit.vertexai.genai.replays import pytest_helper
 from vertexai._genai import types
+import pandas as pd
 
 
 def test_optimize_prompt(client):
@@ -27,18 +28,60 @@ def test_optimize_prompt(client):
     assert response.raw_text_response
 
 
-# def test_optimize_prompt_w_optimization_target(client):
-#     """Tests the optimize request parameters method with optimization target."""
-#     from google.genai import types as genai_types
-#     test_prompt = "Generate system instructions for analyzing medical articles"
-#     response = client.prompt_optimizer.optimize_prompt(
-#         prompt=test_prompt,
-#         config=types.OptimizeConfig(
-#             optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_GEMINI_NANO,
-#         ),
-#     )
-#     assert isinstance(response, types.OptimizeResponse)
-#     assert response.raw_text_response
+def test_optimize_prompt_w_optimization_target(client):
+    """Tests the optimize request parameters method with optimization target."""
+    test_prompt = "Generate system instructions for analyzing medical articles"
+    response = client.prompt_optimizer.optimize_prompt(
+        prompt=test_prompt,
+        config=types.OptimizeConfig(
+            optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_GEMINI_NANO,
+        ),
+    )
+    assert isinstance(response, types.OptimizeResponse)
+    assert response.raw_text_response
+
+
+def test_optimize_prompt_w_few_shot_optimization_target(client):
+    """Tests the optimize request parameters method with few shot optimization target."""
+    test_prompt = "Generate system instructions for analyzing medical articles"
+    df = pd.DataFrame(
+        {
+            "prompt": ["prompt1", "prompt2"],
+            "model_response": ["response1", "response2"],
+            "target_response": ["target1", "target2"],
+        }
+    )
+    response = client.prompt_optimizer.optimize_prompt(
+        prompt=test_prompt,
+        config=types.OptimizeConfig(
+            optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_FEW_SHOT_TARGET_RESPONSE,
+            examples_dataframe=df,
+        ),
+    )
+    assert isinstance(response, types.OptimizeResponse)
+    assert response.raw_text_response
+
+
+def test_optimize_prompt_w_few_shot_optimization_rubrics(client):
+    """Tests the optimize request parameters method with few shot optimization target."""
+    test_prompt = "Generate system instructions for analyzing medical articles"
+    df = pd.DataFrame(
+        {
+            "prompt": ["prompt1", "prompt2"],
+            "model_response": ["response1", "response2"],
+            "rubrics": ["rubric1", "rubric2"],
+            "rubrics_evals": ["[True, True]", "[True, False]"],
+        }
+    )
+    response = client.prompt_optimizer.optimize_prompt(
+        prompt=test_prompt,
+        config=types.OptimizeConfig(
+            optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_FEW_SHOT_RUBRICS,
+            examples_dataframe=df,
+        ),
+    )
+    assert isinstance(response, types.OptimizeResponse)
+    assert response.raw_text_response
 
 
 pytestmark = pytest_helper.setup(
diff --git a/tests/unit/vertexai/genai/test_prompt_optimizer.py b/tests/unit/vertexai/genai/test_prompt_optimizer.py
@@ -21,6 +21,7 @@
 from vertexai._genai import prompt_optimizer
 from vertexai._genai import types
 from google.genai import client
+import pandas as pd
 import pytest
 
 
@@ -91,6 +92,35 @@ def test_prompt_optimizer_optimize_prompt(
         mock_client.assert_called_once()
         mock_custom_optimize_prompt.assert_called_once()
 
+    @mock.patch.object(prompt_optimizer.PromptOptimizer, "_custom_optimize_prompt")
+    def test_prompt_optimizer_optimize_few_shot(self, mock_custom_optimize_prompt):
+        """Test that prompt_optimizer.optimize method for few shot optimizer."""
+        df = pd.DataFrame(
+            {
+                "prompt": ["prompt1", "prompt2"],
+                "model_response": ["response1", "response2"],
+                "target_response": ["target1", "target2"],
+            }
+        )
+        test_client = vertexai.Client(project=_TEST_PROJECT, location=_TEST_LOCATION)
+        test_config = types.OptimizeConfig(
+            optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_FEW_SHOT_TARGET_RESPONSE,
+            examples_dataframe=df,
+        )
+        test_client.prompt_optimizer.optimize_prompt(
+            prompt="test_prompt",
+            config=test_config,
+        )
+        mock_custom_optimize_prompt.assert_called_once()
+        mock_kwargs = mock_custom_optimize_prompt.call_args.kwargs
+        assert (
+            mock_kwargs["config"].optimization_target
+            == test_config.optimization_target
+        )
+        pd.testing.assert_frame_equal(
+            mock_kwargs["config"].examples_dataframe, test_config.examples_dataframe
+        )
+
     @mock.patch.object(prompt_optimizer.PromptOptimizer, "_custom_optimize_prompt")
     def test_prompt_optimizer_optimize_prompt_with_optimization_target(
         self, mock_custom_optimize_prompt
@@ -138,4 +168,59 @@ async def test_async_prompt_optimizer_optimize_prompt_with_optimization_target(
             config=config,
         )
 
+    @pytest.mark.asyncio
+    @mock.patch.object(prompt_optimizer.AsyncPromptOptimizer, "_custom_optimize_prompt")
+    async def test_async_prompt_optimizer_optimize_prompt_few_shot_target_response(
+        self, mock_custom_optimize_prompt
+    ):
+        """Test that async prompt_optimizer.optimize_prompt calls optimize_prompt with few shot target response."""
+        test_client = vertexai.Client(project=_TEST_PROJECT, location=_TEST_LOCATION)
+        df = pd.DataFrame(
+            {
+                "prompt": ["prompt1", "prompt2"],
+                "model_response": ["response1", "response2"],
+                "target_response": ["target1", "target2"],
+            }
+        )
+        config = types.OptimizeConfig(
+            optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_FEW_SHOT_TARGET_RESPONSE,
+            examples_dataframe=df,
+        )
+        await test_client.aio.prompt_optimizer.optimize_prompt(
+            prompt="test_prompt",
+            config=config,
+        )
+        mock_custom_optimize_prompt.assert_called_once_with(
+            content=mock.ANY,
+            config=config,
+        )
+
+    @pytest.mark.asyncio
+    @mock.patch.object(prompt_optimizer.AsyncPromptOptimizer, "_custom_optimize_prompt")
+    async def test_async_prompt_optimizer_optimize_prompt_few_shot_rubrics(
+        self, mock_custom_optimize_prompt
+    ):
+        """Test that async prompt_optimizer.optimize_prompt calls optimize_prompt with few shot rubrics."""
+        test_client = vertexai.Client(project=_TEST_PROJECT, location=_TEST_LOCATION)
+        df = pd.DataFrame(
+            {
+                "prompt": ["prompt1", "prompt2"],
+                "model_response": ["response1", "response2"],
+                "rubrics": ["rubric1", "rubric2"],
+                "rubrics_evals": ["[True, True]", "[True, False]"],
+            }
+        )
+        config = types.OptimizeConfig(
+            optimization_target=types.OptimizeTarget.OPTIMIZATION_TARGET_FEW_SHOT_RUBRICS,
+            examples_dataframe=df,
+        )
+        await test_client.aio.prompt_optimizer.optimize_prompt(
+            prompt="test_prompt",
+            config=config,
+        )
+        mock_custom_optimize_prompt.assert_called_once_with(
+            content=mock.ANY,
+            config=config,
+        )
+
     # # TODO(b/415060797): add more tests for prompt_optimizer.optimize
diff --git a/vertexai/_genai/_prompt_optimizer_utils.py b/vertexai/_genai/_prompt_optimizer_utils.py
@@ -15,9 +15,125 @@
 """Utility functions for prompt optimizer."""
 
 import json
+import logging
+from typing import Optional
+import pandas as pd
 from . import types
 
 
+def _construct_input_prompt(
+    example_df: pd.DataFrame,
+    prompt_col_name: str,
+    model_response_col_name: str,
+    rubrics_col_name: str,
+    rubric_evaluations_col_name: str,
+    target_response_col_name: str,
+    system_instruction: Optional[str] = None,
+) -> str:
+    """Construct the input prompt for the few shot prompt optimizer."""
+
+    all_prompts = []
+    for _, row in example_df.iterrows():
+        example_data = {
+            "prompt": row[prompt_col_name],
+            "model_response": row[model_response_col_name],
+        }
+        if rubrics_col_name:
+            example_data["rubrics"] = row[rubrics_col_name]
+        if rubric_evaluations_col_name:
+            example_data["rubric_evaluations"] = row[rubric_evaluations_col_name]
+        if target_response_col_name:
+            example_data["target_response"] = row[target_response_col_name]
+
+        json_str = json.dumps(example_data, indent=2)
+        all_prompts.append(f"```JSON\n{json_str}\n```")
+
+    all_prompts_str = "\n\n".join(all_prompts)
+
+    if system_instruction is None:
+        system_instruction = ""
+
+    input_prompt = "\n".join(
+        [
+            "Original System Instructions:\n",
+            system_instruction,
+            "Examples:\n",
+            all_prompts_str,
+            "\nNew Output:\n",
+        ]
+    )
+
+    return input_prompt
+
+
+def _get_few_shot_prompt(
+    system_instruction: str,
+    config: types.OptimizeConfig,
+) -> str:
+    """Builds the few shot prompt."""
+
+    if "prompt" not in config.examples_dataframe.columns:
+        raise ValueError("'prompt' is required in the examples_dataframe.")
+    prompt_col_name = "prompt"
+
+    if "model_response" not in config.examples_dataframe.columns:
+        raise ValueError("'model_response' is required in the example_df.")
+    model_response_col_name = "model_response"
+
+    target_response_col_name = ""
+    rubrics_col_name = ""
+    rubric_evaluations_col_name = ""
+
+    if (
+        config.optimization_target
+        == types.OptimizeTarget.OPTIMIZATION_TARGET_FEW_SHOT_TARGET_RESPONSE
+    ):
+        if "target_response" not in config.examples_dataframe.columns:
+            raise ValueError("'target_response' is required in the examples_dataframe.")
+        target_response_col_name = "target_response"
+        if "rubrics" in config.examples_dataframe.columns:
+            raise ValueError(
+                "Only 'target_response' should be provided "
+                "for OPTIMIZATION_TARGET_FEW_SHOT_TARGET_RESPONSE "
+                "but 'rubrics' was provided."
+            )
+
+    elif (
+        config.optimization_target
+        == types.OptimizeTarget.OPTIMIZATION_TARGET_FEW_SHOT_RUBRICS
+    ):
+        if ("rubrics" not in config.examples_dataframe.columns) or (
+            "rubrics_evals" not in config.examples_dataframe.columns
+        ):
+            raise ValueError(
+                "rubrics and rubrics_evals is required in the"
+                "examples_dataframe when rubrics is set."
+            )
+
+        rubrics_col_name = "rubrics"
+        rubric_evaluations_col_name = "rubrics_evals"
+        if "target_response" in config.examples_dataframe.columns:
+            raise ValueError(
+                "Only 'rubrics' and 'rubrics_evals' should be provided "
+                "for OPTIMIZATION_TARGET_FEW_SHOT_RUBRICS "
+                "but target_response was provided."
+            )
+    else:
+        raise ValueError("One of 'target_response' or 'rubrics' must be provided.")
+
+    prompt = _construct_input_prompt(
+        config.examples_dataframe,
+        prompt_col_name,
+        model_response_col_name,
+        rubrics_col_name,
+        rubric_evaluations_col_name,
+        target_response_col_name,
+        system_instruction,
+    )
+
+    return prompt
+
+
 def _get_service_account(
     config: types.PromptOptimizerConfigOrDict,
 ) -> str:
diff --git a/vertexai/_genai/prompt_optimizer.py b/vertexai/_genai/prompt_optimizer.py
diff --git a/vertexai/_genai/types/common.py b/vertexai/_genai/types/common.py