Què és la Finestra de Context?
La finestra de context és la quantitat màxima de text (mesurada en tokens) que un model d'IA pot «veure» simultàniament — incloent tant l'entrada (prompt, documents, historial de conversa) com la sortida generada.
Mides de la finestra de context
Els models 2024-2026 ofereixen finestres cada cop més grans: GPT-4o — 128K tokens (~300 pàgines de text), Claude — 200K tokens, Gemini — fins a 2M tokens. Malgrat això, la finestra de context segueix sent una restricció: més text implica major cost, major latència i potencialment pitjor qualitat.
Estratègies de gestió de context
En sistemes empresarials, la gestió intel·ligent de la finestra de context és clau: RAG (proporcioneu només fragments rellevants, no documents sencers), compressió de context (resum de l'historial de conversa), jerarquia d'agents (cada agent opera sobre el seu propi context més petit) i sistemes de memòria (memòria persistent fora de la finestra de context).