File size: 7,300 Bytes
9eb915e |
|
"""
utils/api_handler.py - API-Kommunikationsmodul für den Dr. Franz Psychochatbot
Dieses Modul verwaltet die Kommunikation mit der HuggingFace Inference API:
- Senden von Anfragen
- Verarbeiten von Antworten
- Fehlerbehandlung und Wiederholungslogik
"""
import requests
import time
import random
import json
from typing import Dict, Any, Optional, List, Union
# Importieren der Konfiguration
import config
class ApiHandler:
"""Klasse zur Verwaltung der API-Kommunikation"""
def __init__(self, api_token: str = config.API_TOKEN, model_id: str = config.MODEL_ID):
"""
Initialisiert den API-Handler
Args:
api_token: Der API-Token für HuggingFace
model_id: Die ID des zu verwendenden Modells
"""
self.api_token = api_token
self.model_id = model_id
self.api_url = f"{config.API_BASE_URL}{model_id}"
self.headers = {"Authorization": f"Bearer {api_token}"}
self.max_retries = 3
self.retry_delay = 2 # Sekunden
def generate_text(self, prompt: str, params: Optional[Dict[str, Any]] = None) -> str:
"""
Generiert Text über die HuggingFace Inference API
Args:
prompt: Der Prompt für die Textgenerierung
params: Optional, Parameter für die Textgenerierung
Returns:
Der generierte Text
"""
# Standardparameter verwenden, wenn keine angegeben sind
if params is None:
params = {
"max_new_tokens": config.MAX_NEW_TOKENS,
"do_sample": True,
"temperature": config.TEMPERATURE,
"top_p": config.TOP_P,
"top_k": config.TOP_K,
"repetition_penalty": config.REPETITION_PENALTY
}
payload = {
"inputs": prompt,
"parameters": params
}
return self._send_api_request(payload)
def _send_api_request(self, payload: Dict[str, Any]) -> str:
"""
Sendet eine Anfrage an die API mit Wiederholungslogik
Args:
payload: Die Anfragedaten
Returns:
Die generierte Antwort
"""
for attempt in range(self.max_retries):
try:
response = requests.post(
self.api_url,
headers=self.headers,
json=payload,
timeout=config.API_TIMEOUT
)
# Prüfen auf erfolgreiche Antwort
if response.status_code == 200:
return self._process_successful_response(response.json())
# Behandlung von Fehlercodes
if response.status_code == 401:
if config.DEBUG_MODE:
print("API-Fehler: Ungültiger API-Token")
return self._get_fallback_response("authentication_error")
if response.status_code == 503 or response.status_code == 429:
# Server überlastet oder Rate-Limit erreicht, erneuter Versuch
if config.DEBUG_MODE:
print(f"API-Fehler: Server überlastet (Versuch {attempt+1}/{self.max_retries})")
time.sleep(self.retry_delay * (attempt + 1)) # Exponentielles Backoff
continue
# Andere Fehler
if config.DEBUG_MODE:
print(f"API-Fehler: Statuscode {response.status_code}")
return self._get_fallback_response("general_error")
except requests.exceptions.Timeout:
if config.DEBUG_MODE:
print(f"API-Timeout (Versuch {attempt+1}/{self.max_retries})")
if attempt < self.max_retries - 1:
time.sleep(self.retry_delay * (attempt + 1))
else:
return self._get_fallback_response("timeout")
except Exception as e:
if config.DEBUG_MODE:
print(f"API-Anfragefehler: {e}")
return self._get_fallback_response("general_error")
# Alle Versuche fehlgeschlagen
return self._get_fallback_response("max_retries")
def _process_successful_response(self, response_data: Union[List[Dict[str, Any]], Dict[str, Any]]) -> str:
"""
Verarbeitet eine erfolgreiche API-Antwort
Args:
response_data: Die Antwortdaten von der API
Returns:
Der extrahierte generierte Text
"""
try:
if isinstance(response_data, list) and len(response_data) > 0 and "generated_text" in response_data[0]:
full_response = response_data[0]["generated_text"]
# Extrahieren der Antwort nach "Dr. Franz:"
if "Dr. Franz:" in full_response:
reply = full_response.split("Dr. Franz:")[-1].strip()
return reply
else:
return full_response
elif isinstance(response_data, dict) and "generated_text" in response_data:
return response_data["generated_text"]
else:
if config.DEBUG_MODE:
print(f"Unerwartetes API-Antwortformat: {response_data}")
return self._get_fallback_response("unexpected_format")
except Exception as e:
if config.DEBUG_MODE:
print(f"Fehler bei der Verarbeitung der API-Antwort: {e}")
return self._get_fallback_response("processing_error")
def _get_fallback_response(self, error_type: str) -> str:
"""
Gibt eine Fallback-Antwort basierend auf dem Fehlertyp zurück
Args:
error_type: Der Typ des aufgetretenen Fehlers
Returns:
Eine passende Fallback-Antwort
"""
# Spezifische Antworten je nach Fehlertyp
error_responses = {
"authentication_error": [
"Es scheint ein Problem mit meiner Verbindung zu geben. Erzählen Sie mir mehr über Ihre Gedanken.",
"Ich muss kurz nachdenken. Was meinen Sie genau mit Ihrer letzten Aussage?"
],
"timeout": [
"Ihre Aussage ist komplex und bedarf tieferer Analyse. Könnten Sie Ihren Gedanken weiter ausführen?",
"Interessant, dass Sie das so formulieren. Ich brauche einen Moment, um das zu verarbeiten."
],
"max_retries": [
"Ihre Gedankengänge sind bemerkenswert verschlungen. Lassen Sie uns einen Schritt zurückgehen.",
"Ich spüre Widerstand in unserer Kommunikation. Vielleicht sollten wir einen anderen Ansatz versuchen."
]
}
# Spezifische Antwort für den Fehlertyp oder allgemeine Fallback-Antwort
if error_type in error_responses:
return random.choice(error_responses[error_type])
else:
return random.choice(config.FALLBACK_RESPONSES)
|