Zurück zum Glossar Technologie

LLM Routing

Intelligente Weiterleitung von Anfragen an das richtige Sprachmodell — basierend auf Komplexität, Kosten und erforderlicher Antwortqualität.

Was ist LLM Routing?

LLM Routing ist die Technik der automatischen Weiterleitung von Anfragen an das am besten geeignete KI-Modell — basierend auf Aufgabenkomplexität, erforderlicher Qualität und Budget. Anstatt jede Anfrage an das teuerste Modell zu senden, analysiert der Router den Inhalt und wählt das optimale Ziel.

Wie funktioniert mehrstufiges Routing?

Das System klassifiziert eingehende Anfragen und leitet sie an die entsprechende Stufe weiter. Einfache FAQ-Fragen gehen an schnelle, günstige Modelle. Mittelkomplexe Aufgaben werden von Mid-Tier-Modellen bearbeitet. Nur wirklich komplexe Probleme, die tiefes Reasoning erfordern, erreichen die teuersten Premium-Modelle.

Kosteneinsparungen

Mehrstufiges Routing kann API-Kosten um 60–80 % reduzieren — ohne Qualitätsverlust. Der Schlüssel ist die richtige Klassifizierung — das System muss erkennen, dass „Wie wird das Wetter?“ nicht dasselbe Modell erfordert wie „Erstelle eine Due-Diligence-Analyse.“

Verwandte Dienstleistungen und Produkte