Čo je kontextové okno?
Kontextové okno je maximálne množstvo textu (merané v tokenoch), ktoré AI model môže „vidieť" súčasne — zahŕňa tak vstup (prompt, dokumenty, históriu konverzácie), ako aj generovaný výstup.
Veľkosti kontextových okien
Modely 2024–2026 ponúkajú stále väčšie okná: GPT-4o — 128K tokenov (~300 strán textu), Claude — 200K tokenov, Gemini — až 2M tokenov. Napriek tomu kontextové okno zostáva obmedzením: viac textu znamená vyššie náklady, dlhšiu latenciu a potenciálne horšiu kvalitu.
Stratégie správy kontextu
V podnikových systémoch je inteligentná správa kontextového okna kľúčová: RAG (poskytnite iba relevantné fragmenty, nie celé dokumenty), kompresia kontextu (sumarizácia histórie konverzácie), hierarchia agentov (každý agent pracuje so svojím menším kontextom) a pamäťové systémy (trvalá pamäť mimo kontextového okna).