Refactor LLM providers for consistent interface and enhanced functionality

brunneis · brunneis · commit ede63fc40096 · 2024-10-03T14:29:30.000Z
- Update all provider classes to use a unified `generate` method signature
- Add support for system prompts and pre-defined message lists
- Implement flexible kwargs handling for provider-specific options
- Replace `max_tokens` and `temperature` params with more generic approach
- Update type hints and imports across all provider files
- Improve error handling and default values in provider initializations
- Standardize payload construction and API call patterns
- Remove unused parameters and simplify client instantiations
diff --git a/llmdk/providers/anthropic.py b/llmdk/providers/anthropic.py
@@ -2,7 +2,7 @@
 # -*- coding: utf-8 -*-
 
 from os import environ as env
-from typing import Any, Optional
+from typing import Any, Optional, List, Dict
 
 from anthropic import Anthropic
 
@@ -30,24 +30,29 @@ def __init__(
     def generate(
         self,
         prompt: str,
-        temperature: Optional[float] = None,
-        max_tokens: Optional[int] = None,
+        system_prompt: Optional[str] = None,
+        messages: Optional[List[Dict[str, str]]] = None,
+        **kwargs: Any,
     ) -> str:
-        payload = {
-            'model': self._model_name,
-            'messages': [{
-                "role": "user",
-                "content": prompt,
-            }],
-        }
-
-        if temperature is not None:
-            payload['temperature'] = temperature
-
-        # Required by Anthropic
-        if max_tokens is None:
-            max_tokens = 4096
-        payload['max_tokens'] = max_tokens
-
-        message = self._client.messages.create(**payload).content[0].text
+        payload = self._generate_kwargs.copy()
+        payload.update(kwargs)
+        payload['model'] = self._model_name
+        payload['max_tokens'] = 4096  # Required
+
+        if messages is not None:
+            payload['messages'] = messages
+        else:
+            payload['messages'] = []
+            if system_prompt:
+                payload['messages'].append({
+                    'role': 'system',
+                    'content': system_prompt,
+                })
+            payload['messages'].append({
+                'role': 'user',
+                'content': prompt,
+            })
+
+        completion = self._client.messages.create(**payload)
+        message = completion.content[0].text
         return message
diff --git a/llmdk/providers/groq.py b/llmdk/providers/groq.py
@@ -2,7 +2,7 @@
 # -*- coding: utf-8 -*-
 
 from os import environ as env
-from typing import Any, Optional
+from typing import Any, Optional, List, Dict
 
 from groq import Groq
 
@@ -14,7 +14,6 @@ def __init__(
         self,
         model_name: str,
         api_key: Optional[str] = None,
-        base_url: Optional[str] = None,
         **kwargs: Any,
     ):
         super().__init__(model_name=model_name, **kwargs)
@@ -24,31 +23,33 @@ def __init__(
 
         self._client = Groq(
             api_key=api_key,
-            base_url=base_url,
         )
 
     def generate(
         self,
         prompt: str,
-        temperature: Optional[float] = None,
-        max_tokens: Optional[int] = None,
+        system_prompt: Optional[str] = None,
+        messages: Optional[List[Dict[str, str]]] = None,
+        **kwargs: Any,
     ) -> str:
-        payload = {
-            'model': self._model_name,
-            'messages': [{
-                "role": "user",
-                "content": prompt,
-            }],
-        }
-
-        if temperature is not None:
-            payload['temperature'] = temperature
-
-        if max_tokens is not None:
-            payload['max_tokens'] = max_tokens
-
-        message = self._client.chat.completions.create(
-            **payload
-        ).choices[0].message.content
-
+        payload = self._generate_kwargs.copy()
+        payload.update(kwargs)
+        payload['model'] = self._model_name
+
+        if messages is not None:
+            payload['messages'] = messages
+        else:
+            payload['messages'] = []
+            if system_prompt:
+                payload['messages'].append({
+                    'role': 'system',
+                    'content': system_prompt,
+                })
+            payload['messages'].append({
+                'role': 'user',
+                'content': prompt,
+            })
+
+        completion = self._client.chat.completions.create(**payload)
+        message = completion.choices[0].message.content
         return message
diff --git a/llmdk/providers/huggingface.py b/llmdk/providers/huggingface.py
@@ -2,7 +2,7 @@
 # -*- coding: utf-8 -*-
 
 from os import environ as env
-from typing import Any, Optional
+from typing import Any, Optional, List, Dict
 
 from huggingface_hub import InferenceClient
 
@@ -22,29 +22,34 @@ def __init__(
             api_key = env.get('HF_TOKEN')
 
         self._client = InferenceClient(
-            model_name,
+            model=model_name,
             token=api_key,
         )
 
     def generate(
         self,
         prompt: str,
-        temperature: Optional[float] = None,
-        max_tokens: Optional[int] = None,
+        system_prompt: Optional[str] = None,
+        messages: Optional[List[Dict[str, str]]] = None,
+        **kwargs: Any,
     ) -> str:
-        payload = {
-            'messages': [{
-                "role": "user",
-                "content": prompt,
-            }],
-        }
-
-        if temperature is not None:
-            payload['temperature'] = temperature
-
-        max_tokens = max_tokens or self._max_tokens
-        if max_tokens is not None:
-            payload['max_tokens'] = max_tokens
+        payload = self._generate_kwargs.copy()
+        payload.update(kwargs)
+        payload['model'] = self._model_name
+
+        if messages is not None:
+            payload['messages'] = messages
+        else:
+            payload['messages'] = []
+            if system_prompt:
+                payload['messages'].append({
+                    'role': 'system',
+                    'content': system_prompt,
+                })
+            payload['messages'].append({
+                'role': 'user',
+                'content': prompt,
+            })
 
         completion = self._client.chat_completion(**payload)
         message = completion.choices[0].message.content
diff --git a/llmdk/providers/interface.py b/llmdk/providers/interface.py
@@ -1,17 +1,17 @@
 #!/usr/bin/env python
 # -*- coding: utf-8 -*-
 
-from typing import Optional
+from typing import Any, Optional
 
 
 class LlmInterface:
     def __init__(
         self,
         model_name: str,
-        max_tokens: Optional[int] = None,
+        **kwargs: Any,
     ):
         self._model_name = model_name
-        self._max_tokens = max_tokens
+        self._generate_kwargs = kwargs
 
     @property
     def model_name(self) -> str:
@@ -22,5 +22,6 @@ def generate(
         prompt: str,
         temperature: Optional[float] = None,
         max_tokens: Optional[int] = None,
+        **kwargs: Any,
     ) -> str:
         raise NotImplementedError
diff --git a/llmdk/providers/ollama.py b/llmdk/providers/ollama.py
@@ -2,7 +2,7 @@
 # -*- coding: utf-8 -*-
 
 from os import environ as env
-from typing import Any, Optional
+from typing import Any, Optional, List, Dict
 
 from ollama import Client
 
@@ -12,48 +12,55 @@
 class OllamaClient(LlmInterface):
     def __init__(
         self,
-        base_url: str,
         model_name: str,
+        base_url: Optional[str] = None,
         headers: Optional[dict] = None,
         options: Optional[dict] = None,
         **kwargs: Any,
     ):
         super().__init__(model_name=model_name, **kwargs)
 
+        if not base_url:
+            base_url = env.get('OLLAMA_API_URL') or 'http://localhost:11434'
+
         self._client = Client(
             host=base_url,
-            headers=headers,
+            headers=headers or {},
         )
 
-        self._options = options
-        if self._options is None:
-            self._options = {}
+        self._options = options or {}
 
     def generate(
         self,
         prompt: str,
-        temperature: Optional[float] = None,
-        max_tokens: Optional[int] = None,
+        system_prompt: Optional[str] = None,
+        messages: Optional[List[Dict[str, str]]] = None,
+        options: Optional[dict] = None,
+        **kwargs: Any,
     ) -> str:
-        payload = {
-            'model': self._model_name,
-            'messages': [{
-                "role": "user",
-                "content": prompt,
-            }],
-        }
-
-        options = dict(self._options)
-        payload['options'] = options
-
-        if temperature is not None:
-            options['temperature'] = temperature
+        payload = self._generate_kwargs.copy()
+        payload.update(kwargs)
+        payload['model'] = self._model_name
 
-        if max_tokens is not None:
-            options['num_predict'] = max_tokens
+        if messages is not None:
+            payload['messages'] = messages
+        else:
+            payload['messages'] = []
+            if system_prompt:
+                payload['messages'].append({
+                    'role': 'system',
+                    'content': system_prompt,
+                })
+            payload['messages'].append({
+                'role': 'user',
+                'content': prompt,
+            })
 
-        message = self._client.chat(
-            **payload
-        )['message']['content']
+        merged_options = self._options.copy()
+        if options:
+            merged_options.update(options)
+        payload['options'] = merged_options
 
+        response = self._client.chat(**payload)
+        message = response['message']['content']
         return message
diff --git a/llmdk/providers/openai.py b/llmdk/providers/openai.py
@@ -2,7 +2,7 @@
 # -*- coding: utf-8 -*-
 
 from os import environ as env
-from typing import Any, Optional
+from typing import Any, Optional, List, Dict
 
 from openai import OpenAI
 
@@ -33,23 +33,27 @@ def __init__(
     def generate(
         self,
         prompt: str,
-        temperature: Optional[float] = None,
-        max_tokens: Optional[int] = None,
+        system_prompt: Optional[str] = None,
+        messages: Optional[List[Dict[str, str]]] = None,
+        **kwargs: Any,
     ) -> str:
-        payload = {
-            'model': self._model_name,
-            'messages': [{
-                "role": "user",
-                "content": prompt,
-            }],
-        }
-
-        if temperature is not None:
-            payload['temperature'] = temperature
-
-        max_tokens = max_tokens or self._max_tokens
-        if max_tokens is not None:
-            payload['max_tokens'] = max_tokens
+        payload = self._generate_kwargs.copy()
+        payload.update(kwargs)
+        payload['model'] = self._model_name
+
+        if messages is not None:
+            payload['messages'] = messages
+        else:
+            payload['messages'] = []
+            if system_prompt:
+                payload['messages'].append({
+                    'role': 'system',
+                    'content': system_prompt,
+                })
+            payload['messages'].append({
+                'role': 'user',
+                'content': prompt,
+            })
 
         completion = self._client.chat.completions.create(**payload)
         message = completion.choices[0].message.content
diff --git a/llmdk/providers/vllm.py b/llmdk/providers/vllm.py