Co je kontextové okno?
Kontextové okno je maximální množství textu (měřené v tokenech), které AI model může „vidět" současně — zahrnuje jak vstup (prompt, dokumenty, historii konverzace), tak generovaný výstup.
Velikosti kontextových oken
Modely 2024–2026 nabízejí stále větší okna: GPT-4o — 128K tokenů (~300 stran textu), Claude — 200K tokenů, Gemini — až 2M tokenů. Přesto kontextové okno zůstává omezením: více textu znamená vyšší náklady, delší latenci a potenciálně horší kvalitu.
Strategie správy kontextu
V podnikových systémech je chytrá správa kontextového okna klíčová: RAG (poskytněte pouze relevantní fragmenty, ne celé dokumenty), komprese kontextu (sumarizace historie konverzace), hierarchie agentů (každý agent pracuje se svým menším kontextem) a paměťové systémy (trvalá paměť mimo kontextové okno).