Zurück zum Glossar Technologie

Kontextfenster

Maximale Textmenge (Token), die ein KI-Modell in einer einzelnen Anfrage verarbeiten kann — eine zentrale LLM-Leistungsbeschränkung.

Was ist ein Kontextfenster?

Ein Kontextfenster ist die maximale Textmenge (gemessen in Token), die ein KI-Modell gleichzeitig „sehen“ kann — einschließlich Eingabe (Prompt, Dokumente, Gesprächsverlauf) und generierter Ausgabe.

Kontextfenstergrößen

Modelle von 2024–2026 bieten zunehmend größere Fenster: GPT-4o — 128K Token (~300 Textseiten), Claude — 200K Token, Gemini — bis zu 2M Token. Trotzdem bleibt das Kontextfenster eine Einschränkung: mehr Text bedeutet höhere Kosten, längere Latenz und potenziell schlechtere Qualität.

Strategien zum Kontextmanagement

In Unternehmenssystemen ist intelligentes Kontextfenster-Management entscheidend: RAG (nur relevante Fragmente bereitstellen, nicht ganze Dokumente), Kontextkomprimierung (Zusammenfassung des Gesprächsverlaufs), Agentenhierarchie (jeder Agent arbeitet mit seinem eigenen kleineren Kontext) und Speichersysteme (persistenter Speicher außerhalb des Kontextfensters).

Verwandte Dienstleistungen und Produkte