Changed embedding model (#1850)

himanshugt16 · web-flow · commit 0c451765e241 · 2025-03-13T10:33:39.000+05:30
diff --git a/kairon/shared/llm/processor.py b/kairon/shared/llm/processor.py
@@ -33,7 +33,7 @@
 class LLMProcessor(LLMBase):
     _sparse_embedding = None
     _rerank_embedding = None
-    __embedding__ = 1536
+    __embedding__ = 3072
 
     def __init__(self, bot: Text, llm_type: str):
         super().__init__(bot)
@@ -155,7 +155,7 @@ async def get_embedding(self, texts: Union[Text, List[Text]], user, **kwargs):
         truncated_texts = self.truncate_text(texts)
 
         result = await litellm.aembedding(
-            model="text-embedding-3-small",
+            model="text-embedding-3-large",
             input=truncated_texts,
             metadata={'user': user, 'bot': self.bot, 'invocation': kwargs.get("invocation")},
             api_key=self.llm_secret_embedding.get('api_key'),
diff --git a/tests/integration_test/action_service_test.py b/tests/integration_test/action_service_test.py
@@ -4170,7 +4170,7 @@ def test_vectordb_action_execution_embedding_search_from_value(mock_embedding):
     log = ActionServerLogs.objects(action=action_name, bot='5f50fd0a56b698ca10d75d2e').get().to_mongo().to_dict()
     log.pop('_id')
     log.pop('timestamp')
-    expected = {"model": "text-embedding-3-small",
+    expected = {"model": "text-embedding-3-large",
                 "input": [payload_body],
                 'metadata': {'user': 'default', 'bot': '5f50fd0a56b698ca10d75d2e', 'invocation': 'db_action_qdrant'},
                 "api_key": 'key_value',
@@ -4422,7 +4422,7 @@ def test_vectordb_action_execution_embedding_search_from_slot(mock_embedding):
     log = ActionServerLogs.objects(action=action_name, bot='5f50fx0a56b698ca10d35d2e').get().to_mongo().to_dict()
     log.pop('_id')
     log.pop('timestamp')
-    expected = {"model": "text-embedding-3-small",
+    expected = {"model": "text-embedding-3-large",
                 "input": [payload],
                 'metadata': {'user': 'default', 'bot': '5f50fx0a56b698ca10d35d2e', 'invocation': 'db_action_qdrant'},
                 "api_key": 'key_value',
@@ -4527,7 +4527,7 @@ def test_vectordb_action_execution_embedding_search_no_response_dispatch(mock_em
     log = ActionServerLogs.objects(action=action_name, bot='5f50fd0a56v098ca10d75d2e').get().to_mongo().to_dict()
     log.pop('_id')
     log.pop('timestamp')
-    expected = {"model": "text-embedding-3-small",
+    expected = {"model": "text-embedding-3-large",
                 "input": [payload_body],
                 'metadata': {'user': 'default', 'bot': '5f50fd0a56v098ca10d75d2e', 'invocation': 'db_action_qdrant'},
                 "api_key": 'key_value',
@@ -13831,7 +13831,7 @@ def test_vectordb_action_execution_embedding_payload_search(mock_embedding):
     log = ActionServerLogs.objects(action=action_name, bot=bot).get().to_mongo().to_dict()
     log.pop('_id')
     log.pop('timestamp')
-    expected = {"model": "text-embedding-3-small",
+    expected = {"model": "text-embedding-3-large",
                 "input": ["Hi How are you"],
                 'metadata': {'user': 'default', 'bot': bot, 'invocation': 'db_action_qdrant'},
                 "api_key": 'key_value',
diff --git a/tests/integration_test/services_test.py b/tests/integration_test/services_test.py
@@ -2012,14 +2012,14 @@ def test_knowledge_vault_sync_push_menu(mock_embedding, mock_collection_exists,
 
     expected_calls = [
         {
-            "model": "text-embedding-3-small",
+            "model": "text-embedding-3-large",
             "input": ['{"id":1,"item":"Juice","price":2.5,"quantity":10}'],  # First input
             "metadata": {'user': 'integration@demo.ai', 'bot': pytest.bot, 'invocation': 'knowledge_vault_sync'},
             "api_key": "common_openai_key",
             "num_retries": 3
         },
         {
-            "model": "text-embedding-3-small",
+            "model": "text-embedding-3-large",
             "input": ['{"id":2,"item":"Apples","price":1.2,"quantity":20}'],  # Second input
             "metadata": {'user': 'integration@demo.ai', 'bot': pytest.bot, 'invocation': 'knowledge_vault_sync'},
             "api_key": "common_openai_key",
@@ -2150,14 +2150,14 @@ def test_knowledge_vault_sync_field_update(mock_embedding, mock_collection_exist
 
     expected_calls = [
         {
-            "model": "text-embedding-3-small",
+            "model": "text-embedding-3-large",
             "input": ['{"id":1,"item":"Juice","price":80.5,"quantity":56}'],
             "metadata": {'user': 'integration@demo.ai', 'bot': pytest.bot, 'invocation': 'knowledge_vault_sync'},
             "api_key": "common_openai_key",
             "num_retries": 3
         },
         {
-            "model": "text-embedding-3-small",
+            "model": "text-embedding-3-large",
             "input": ['{"id":2,"item":"Milk","price":27.0,"quantity":12}'],  # Second input
             "metadata": {'user': 'integration@demo.ai', 'bot': pytest.bot, 'invocation': 'knowledge_vault_sync'},
             "api_key": "common_openai_key",
diff --git a/tests/unit_test/data_processor/data_processor_test.py b/tests/unit_test/data_processor/data_processor_test.py
@@ -2131,7 +2131,7 @@ async def test_sync_with_qdrant_success(self, mock_collection_upsert, mock_embed
         )
 
         mock_embedding.assert_called_once_with(
-            model="text-embedding-3-small",
+            model="text-embedding-3-large",
             input=['{"id":2,"item":"Milk","price":2.8,"quantity":5}'],
             metadata={'user': user, 'bot': bot, 'invocation': 'knowledge_vault_sync'},
             api_key="openai_key",
@@ -2229,7 +2229,7 @@ async def test_sync_with_qdrant_upsert_failure(self, mock_request, mock_embeddin
             )
 
         mock_embedding.assert_called_once_with(
-            model="text-embedding-3-small",
+            model="text-embedding-3-large",
             input=['{"id":2,"item":"Milk","price":2.8,"quantity":5}'],
             metadata={'user': user, 'bot': bot, 'invocation': 'knowledge_vault_sync'},
             api_key="openai_key",
diff --git a/tests/unit_test/llm_test.py b/tests/unit_test/llm_test.py
@@ -97,7 +97,7 @@ async def test_gpt3_faq_embedding_train(self, mock_embedding, aioresponses):
                             'payload': {'content': test_content.data}
                             }]}
 
-            expected = {"model": "text-embedding-3-small",
+            expected = {"model": "text-embedding-3-large",
                         "input": [test_content.data], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                         "api_key": value,
                         "num_retries": 3}
@@ -223,7 +223,7 @@ async def test_gpt3_faq_embedding_train_payload_text(self, mock_embedding, aiore
                             'payload': {'name': 'Nupur'}}]}
             assert response['faq'] == 3
 
-            expected = {"model": "text-embedding-3-small",
+            expected = {"model": "text-embedding-3-large",
                         "input": [json.dumps(test_content.data)],
                         'metadata': {'user': user, 'bot': bot, 'invocation': None},
                         "api_key": value,
@@ -294,7 +294,7 @@ async def test_gpt3_faq_embedding_train_payload_with_int(self, mock_embedding, a
                             'payload': {'name': 'Ram', 'age': 23, 'color': 'red'}
                             }]}
 
-            expected = {"model": "text-embedding-3-small",
+            expected = {"model": "text-embedding-3-large",
                         "input": [json.dumps(input)], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                         "api_key": value,
                         "num_retries": 3}
@@ -375,7 +375,7 @@ async def test_gpt3_faq_embedding_train_int(self, mock_embedding, aioresponses):
                             'payload': expected_payload
                             }]}
 
-            expected = {"model": "text-embedding-3-small",
+            expected = {"model": "text-embedding-3-large",
                         "input": [json.dumps(input)], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                         "api_key": value,
                         "num_retries": 3}
@@ -445,7 +445,7 @@ async def test_gpt3_faq_embedding_train_upsert_error(self, mock_embedding, aiore
                 'points': [{'id': test_content.vector_id,
                             'vector': embedding, 'payload': {'content': test_content.data}}]}
 
-            expected = {"model": "text-embedding-3-small",
+            expected = {"model": "text-embedding-3-large",
                         "input": [test_content.data], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                         "api_key": value,
                         "num_retries": 3}
@@ -525,7 +525,7 @@ async def test_gpt3_faq_embedding_train_payload_upsert_error_json(self, mock_emb
                             'payload': expected_payload
                             }]}
 
-            expected = {"model": "text-embedding-3-small",
+            expected = {"model": "text-embedding-3-large",
                         "input": [json.dumps(test_content.data)], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                         "api_key": value,
                         "num_retries": 3}
@@ -597,7 +597,7 @@ async def test_gpt3_faq_embedding_predict(self, mock_embedding, aioresponses):
                                                                                  'score_threshold': 0.70}
             assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-            expected = {"model": "text-embedding-3-small",
+            expected = {"model": "text-embedding-3-large",
                         "input": [query], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                         "api_key": value,
                         "num_retries": 3}
@@ -672,7 +672,7 @@ async def test_gpt3_faq_embedding_predict_with_default_collection(self, mock_emb
 
         assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-        expected = {"model": "text-embedding-3-small",
+        expected = {"model": "text-embedding-3-large",
                     "input": [query], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                     "api_key": value,
                     "num_retries": 3}
@@ -749,7 +749,7 @@ async def test_gpt3_faq_embedding_predict_with_values(self, mock_embedding, aior
 
             assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-            expected = {"model": "text-embedding-3-small",
+            expected = {"model": "text-embedding-3-large",
                         "input": [query], 'metadata': {'user': user, 'bot': gpt3.bot, 'invocation': None},
                         "api_key": key,
                         "num_retries": 3}
@@ -825,7 +825,7 @@ async def test_gpt3_faq_embedding_predict_with_values_and_stream(self, mock_embe
 
             assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-            expected = {"model": "text-embedding-3-small",
+            expected = {"model": "text-embedding-3-large",
                         "input": [query], 'metadata': {'user': user, 'bot': gpt3.bot, 'invocation': None},
                         "api_key": key,
                         "num_retries": 3}
@@ -938,7 +938,7 @@ async def test_gpt3_faq_embedding_predict_with_values_with_instructions(self,
 
         assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-        expected = {"model": "text-embedding-3-small",
+        expected = {"model": "text-embedding-3-large",
                     "input": [query], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                     "api_key": key,
                     "num_retries": 3}
@@ -1013,7 +1013,7 @@ async def test_gpt3_faq_embedding_predict_completion_connection_error(self, mock
                                                                              'score_threshold': 0.70}
         assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-        expected = {"model": "text-embedding-3-small",
+        expected = {"model": "text-embedding-3-large",
                     "input": [query], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                     "api_key": key,
                     "num_retries": 3}
@@ -1067,7 +1067,7 @@ async def test_gpt3_faq_embedding_predict_exact_match(self, mock_embedding, mock
             {'error': 'Retrieving chat completion for the provided query. Failed to connect to service: localhost'}]
         assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-        expected = {"model": "text-embedding-3-small",
+        expected = {"model": "text-embedding-3-large",
                     "input": [query], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                     "api_key": key,
                     "num_retries": 3}
@@ -1113,7 +1113,7 @@ async def test_gpt3_faq_embedding_predict_embedding_connection_error(self, mock_
         assert gpt3.logs == [{'error': 'Creating a new embedding for the provided query. Connection reset by peer!'}]
         assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-        expected = {"model": "text-embedding-3-small",
+        expected = {"model": "text-embedding-3-large",
                     "input": [query], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                     "api_key": key,
                     "num_retries": 3}
@@ -1198,7 +1198,7 @@ async def test_gpt3_faq_embedding_predict_with_previous_bot_responses(self, mock
 
         assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-        expected = {"model": "text-embedding-3-small",
+        expected = {"model": "text-embedding-3-large",
                     "input": [query], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                     "api_key": key,
                     "num_retries": 3}
@@ -1292,7 +1292,7 @@ async def test_gpt3_faq_embedding_predict_with_query_prompt(self, mock_embedding
                                                                              'score_threshold': 0.70}
         assert isinstance(time_elapsed, float) and time_elapsed > 0.0
 
-        expected = {"model": "text-embedding-3-small",
+        expected = {"model": "text-embedding-3-large",
                     "input": [query], 'metadata': {'user': user, 'bot': bot, 'invocation': None},
                     "api_key": key,
                     "num_retries": 3}
@@ -1926,7 +1926,7 @@ def test_rerank_embedding_raises_exception(self, mock_rerank):
     #     }
     #
     #     mock_dense.assert_called_once_with(
-    #         model="text-embedding-3-small",
+    #         model="text-embedding-3-large",
     #         input=[text],
     #         metadata={'user': user, 'bot': bot, 'invocation': None},
     #         api_key=key,
@@ -1990,7 +1990,7 @@ def test_rerank_embedding_raises_exception(self, mock_rerank):
     #     }
     #
     #     mock_dense.assert_called_once_with(
-    #         model="text-embedding-3-small",
+    #         model="text-embedding-3-large",
     #         input=texts,
     #         metadata={'user': user, 'bot': bot, 'invocation': None},
     #         api_key=key,
@@ -2043,7 +2043,7 @@ def test_rerank_embedding_raises_exception(self, mock_rerank):
     #         await processor.get_embedding(texts, user)
     #
     #     mock_dense.assert_called_once_with(
-    #         model="text-embedding-3-small",
+    #         model="text-embedding-3-large",
     #         input=texts,
     #         metadata={'user': user, 'bot': bot, 'invocation': None},
     #         api_key=key,
@@ -2092,7 +2092,7 @@ def test_rerank_embedding_raises_exception(self, mock_rerank):
     #         await processor.get_embedding(texts, user)
     #
     #     mock_dense.assert_called_once_with(
-    #         model="text-embedding-3-small",
+    #         model="text-embedding-3-large",
     #         input=texts,
     #         metadata={'user': user, 'bot': bot, 'invocation': None},
     #         api_key=key,
@@ -2141,7 +2141,7 @@ def test_rerank_embedding_raises_exception(self, mock_rerank):
     #         await processor.get_embedding(texts, user)
     #
     #     mock_dense.assert_called_once_with(
-    #         model="text-embedding-3-small",
+    #         model="text-embedding-3-large",
     #         input=texts,
     #         metadata={'user': user, 'bot': bot, 'invocation': None},
     #         api_key=key,