Was ist ein Kontextfenster?
Ein Kontextfenster ist die maximale Textmenge (gemessen in Token), die ein KI-Modell gleichzeitig „sehen“ kann — einschließlich Eingabe (Prompt, Dokumente, Gesprächsverlauf) und generierter Ausgabe.
Kontextfenstergrößen
Modelle von 2024–2026 bieten zunehmend größere Fenster: GPT-4o — 128K Token (~300 Textseiten), Claude — 200K Token, Gemini — bis zu 2M Token. Trotzdem bleibt das Kontextfenster eine Einschränkung: mehr Text bedeutet höhere Kosten, längere Latenz und potenziell schlechtere Qualität.
Strategien zum Kontextmanagement
In Unternehmenssystemen ist intelligentes Kontextfenster-Management entscheidend: RAG (nur relevante Fragmente bereitstellen, nicht ganze Dokumente), Kontextkomprimierung (Zusammenfassung des Gesprächsverlaufs), Agentenhierarchie (jeder Agent arbeitet mit seinem eigenen kleineren Kontext) und Speichersysteme (persistenter Speicher außerhalb des Kontextfensters).