Ce este fereastra de context?
Fereastra de context este cantitatea maximă de text (măsurată în tokeni) pe care un model AI o poate „vedea" simultan — incluzând atât intrarea (prompt, documente, istoricul conversației), cât și ieșirea generată.
Dimensiunile ferestrelor de context
Modelele din 2024–2026 oferă ferestre din ce în ce mai mari: GPT-4o — 128K tokeni (~300 pagini de text), Claude — 200K tokeni, Gemini — până la 2M tokeni. Cu toate acestea, fereastra de context rămâne o constrângere: mai mult text înseamnă costuri mai mari, latență mai mare și potențial calitate mai slabă.
Strategii de gestionare a contextului
În sistemele enterprise, gestionarea inteligentă a ferestrei de context este esențială: RAG (furnizați doar fragmentele relevante, nu documente întregi), comprimarea contextului (rezumarea istoricului conversației), ierarhia agenților (fiecare agent operează pe propriul context mai mic) și sisteme de memorie (memorie persistentă în afara ferestrei de context).