Update SE and MP examples for metrics

arjav-desai · arjav-desai · commit aee9252b3069 · 2025-08-26T13:58:21.000-05:00
diff --git a/examples/integrations/langchain4j/coffee-shop-assistant-mp/README.md b/examples/integrations/langchain4j/coffee-shop-assistant-mp/README.md
@@ -64,3 +64,31 @@ Here are some example queries you can try:
 - **"Can I order a coffee and a cookie?"**
    - *Expected Response:*  
      *"Your order for a coffee and a chocolate chip cookie has been saved. The total is $5.00. Would you like anything else?"*
+
+## Try metrics
+
+Helidon provides `MetricsChatModelListener` which generates metrics that follow the [Semantic Conventions for GenAI Metrics](https://opentelemetr.io/docs/specs/semconv/gen-ai/gen-ai-metrics). This is done out-of-box for Chat API calls. To view the captured metrics use following:
+
+```shell
+# Prometheus Format
+curl -s -X GET http://localhost:8080/metrics
+...
+# HELP gen_ai_client_token_usage_token Measures number of input and output tokens used
+# TYPE gen_ai_client_token_usage_token histogram
+gen_ai_client_token_usage_token{gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",gen_ai_token_type="output",scope="vendor",quantile="0.5",} 71.0
+...
+gen_ai_client_token_usage_token{gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",gen_ai_token_type="input",scope="vendor",quantile="0.5",} 156.0
+...
+# HELP gen_ai_client_token_usage_token_max Measures number of input and output tokens used
+# TYPE gen_ai_client_token_usage_token_max gauge
+gen_ai_client_token_usage_token_max{gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",gen_ai_token_type="output",scope="vendor",} 71.0
+gen_ai_client_token_usage_token_max{gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",gen_ai_token_type="input",scope="vendor",} 156.0
+....
+# HELP gen_ai_client_operation_duration_seconds_max GenAI operation duration
+# TYPE gen_ai_client_operation_duration_seconds_max gauge
+gen_ai_client_operation_duration_seconds_max{error_type="",gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",scope="vendor",} 2.0
+# HELP gen_ai_client_operation_duration_seconds GenAI operation duration
+# TYPE gen_ai_client_operation_duration_seconds histogram
+gen_ai_client_operation_duration_seconds{error_type="",gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",scope="vendor",quantile="0.5",} 2.0
+...
+```
diff --git a/examples/integrations/langchain4j/coffee-shop-assistant-mp/pom.xml b/examples/integrations/langchain4j/coffee-shop-assistant-mp/pom.xml
@@ -41,16 +41,6 @@
         <mainClass>io.helidon.Main</mainClass>
     </properties>
 
-    <dependencyManagement>
-        <dependencies>
-            <dependency>
-                <groupId>dev.langchain4j</groupId>
-                <artifactId>langchain4j-embeddings-all-minilm-l6-v2</artifactId>
-                <version>${version.lib.langchain4j}</version>
-            </dependency>
-        </dependencies>
-    </dependencyManagement>
-
     <dependencies>
         <dependency>
             <groupId>io.helidon.integrations.langchain4j</groupId>
diff --git a/examples/integrations/langchain4j/coffee-shop-assistant-mp/src/main/resources/META-INF/microprofile-config.properties b/examples/integrations/langchain4j/coffee-shop-assistant-mp/src/main/resources/META-INF/microprofile-config.properties
@@ -25,6 +25,6 @@ langchain4j.open-ai.chat-model.model-name=gpt-4o-mini
 langchain4j.rag.embedding-store-content-retriever.enabled=true
 langchain4j.rag.embedding-store-content-retriever.max-results=10
 langchain4j.rag.embedding-store-content-retriever.min-score=0.6
-langchain4j.rag.embedding-store-content-retriever.embedding-store=EmbeddingStore
+langchain4j.rag.embedding-store-content-retriever.embedding-store.service-registry.named=EmbeddingStore
 
 app.menu-items=data/menu.json
diff --git a/examples/integrations/langchain4j/coffee-shop-assistant-se-coherence/src/main/java/io/helidon/examples/integrations/langchain4j/se/coffee/shop/assistant/ai/ChatAiService.java b/examples/integrations/langchain4j/coffee-shop-assistant-se-coherence/src/main/java/io/helidon/examples/integrations/langchain4j/se/coffee/shop/assistant/ai/ChatAiService.java
@@ -27,7 +27,7 @@
  * the service registry.
  */
 @Ai.Service
-@Ai.ChatMemoryWindow(value=3,store="CoherenceChatMemoryStore")
+@Ai.ChatMemoryWindow(value=3,store="coherence")
 public interface ChatAiService {
 
     /**
diff --git a/examples/integrations/langchain4j/coffee-shop-assistant-se/README.md b/examples/integrations/langchain4j/coffee-shop-assistant-se/README.md
@@ -64,3 +64,31 @@ Here are some example queries you can try:
 - **"Can I order a coffee and a cookie?"**  
   - *Expected Response:*  
   *"Your order for a coffee and a chocolate chip cookie has been saved. The total is $5.00. Would you like anything else?"*
+
+## Try metrics
+
+Helidon provides `MetricsChatModelListener` which generates metrics that follow the [Semantic Conventions for GenAI Metrics](https://opentelemetr.io/docs/specs/semconv/gen-ai/gen-ai-metrics). This is done out-of-box for Chat API calls. To view the captured metrics use following: 
+
+```shell
+# Prometheus Format
+curl -s -X GET http://localhost:8080/observe/metrics
+...
+# HELP gen_ai_client_token_usage_token Measures number of input and output tokens used
+# TYPE gen_ai_client_token_usage_token histogram
+gen_ai_client_token_usage_token{gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",gen_ai_token_type="output",scope="vendor",quantile="0.5",} 71.0
+...
+gen_ai_client_token_usage_token{gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",gen_ai_token_type="input",scope="vendor",quantile="0.5",} 156.0
+...
+# HELP gen_ai_client_token_usage_token_max Measures number of input and output tokens used
+# TYPE gen_ai_client_token_usage_token_max gauge
+gen_ai_client_token_usage_token_max{gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",gen_ai_token_type="output",scope="vendor",} 71.0
+gen_ai_client_token_usage_token_max{gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",gen_ai_token_type="input",scope="vendor",} 156.0
+....
+# HELP gen_ai_client_operation_duration_seconds_max GenAI operation duration
+# TYPE gen_ai_client_operation_duration_seconds_max gauge
+gen_ai_client_operation_duration_seconds_max{error_type="",gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",scope="vendor",} 2.0
+# HELP gen_ai_client_operation_duration_seconds GenAI operation duration
+# TYPE gen_ai_client_operation_duration_seconds histogram
+gen_ai_client_operation_duration_seconds{error_type="",gen_ai_operation_name="chat",gen_ai_request_model="gpt-4o-mini",gen_ai_response_model="gpt-4o-mini-2024-07-18",scope="vendor",quantile="0.5",} 2.0
+...
+```
diff --git a/examples/integrations/langchain4j/coffee-shop-assistant-se/pom.xml b/examples/integrations/langchain4j/coffee-shop-assistant-se/pom.xml
@@ -41,16 +41,6 @@
         <mainClass>io.helidon.examples.integrations.langchain4j.se.coffee.shop.assistant.ApplicationMain</mainClass>
     </properties>
 
-    <dependencyManagement>
-        <dependencies>
-            <dependency>
-                <groupId>dev.langchain4j</groupId>
-                <artifactId>langchain4j-embeddings-all-minilm-l6-v2</artifactId>
-                <version>${version.lib.langchain4j}</version>
-            </dependency>
-        </dependencies>
-    </dependencyManagement>
-
     <dependencies>
         <dependency>
             <groupId>io.helidon.integrations.langchain4j</groupId>
@@ -72,6 +62,15 @@
             <groupId>io.helidon.config</groupId>
             <artifactId>helidon-config-yaml</artifactId>
         </dependency>
+        <dependency>
+            <groupId>io.helidon.webserver.observe</groupId>
+            <artifactId>helidon-webserver-observe-metrics</artifactId>
+        </dependency>
+        <dependency>
+            <groupId>io.helidon.metrics</groupId>
+            <artifactId>helidon-metrics-system-meters</artifactId>
+            <scope>runtime</scope>
+        </dependency>
         <dependency>
             <groupId>dev.langchain4j</groupId>
             <artifactId>langchain4j-embeddings-all-minilm-l6-v2-q</artifactId>
diff --git a/examples/integrations/langchain4j/coffee-shop-assistant-se/src/main/resources/application.yaml b/examples/integrations/langchain4j/coffee-shop-assistant-se/src/main/resources/application.yaml
@@ -30,6 +30,7 @@ langchain4j:
       enabled: true
       max-results: 10
       min-score: 0.6
-      embedding-store: "EmbeddingStore"
+      embedding-store:
+        service-registry.named: "EmbeddingStore"
 app:
   menu-items: "data/menu.json"