Späť na slovník Technológie

Kontextové okno

Maximálne množstvo textu (tokenov), ktoré AI model dokáže spracovať v jednom dotaze — kľúčové obmedzenie výkonu LLM.

Čo je kontextové okno?

Kontextové okno je maximálne množstvo textu (merané v tokenoch), ktoré AI model môže „vidieť" súčasne — zahŕňa tak vstup (prompt, dokumenty, históriu konverzácie), ako aj generovaný výstup.

Veľkosti kontextových okien

Modely 2024–2026 ponúkajú stále väčšie okná: GPT-4o — 128K tokenov (~300 strán textu), Claude — 200K tokenov, Gemini — až 2M tokenov. Napriek tomu kontextové okno zostáva obmedzením: viac textu znamená vyššie náklady, dlhšiu latenciu a potenciálne horšiu kvalitu.

Stratégie správy kontextu

V podnikových systémoch je inteligentná správa kontextového okna kľúčová: RAG (poskytnite iba relevantné fragmenty, nie celé dokumenty), kompresia kontextu (sumarizácia histórie konverzácie), hierarchia agentov (každý agent pracuje so svojím menším kontextom) a pamäťové systémy (trvalá pamäť mimo kontextového okna).