Zpět na slovník Technologie

Kontextové okno

Maximální množství textu (tokenů), které AI model dokáže zpracovat v jednom dotazu — klíčové omezení výkonu LLM.

Co je kontextové okno?

Kontextové okno je maximální množství textu (měřené v tokenech), které AI model může „vidět" současně — zahrnuje jak vstup (prompt, dokumenty, historii konverzace), tak generovaný výstup.

Velikosti kontextových oken

Modely 2024–2026 nabízejí stále větší okna: GPT-4o — 128K tokenů (~300 stran textu), Claude — 200K tokenů, Gemini — až 2M tokenů. Přesto kontextové okno zůstává omezením: více textu znamená vyšší náklady, delší latenci a potenciálně horší kvalitu.

Strategie správy kontextu

V podnikových systémech je chytrá správa kontextového okna klíčová: RAG (poskytněte pouze relevantní fragmenty, ne celé dokumenty), komprese kontextu (sumarizace historie konverzace), hierarchie agentů (každý agent pracuje se svým menším kontextem) a paměťové systémy (trvalá paměť mimo kontextové okno).