Tornar al glossari Tecnologia

Finestra de Context

Quantitat màxima de text (tokens) que un model d'IA pot processar en una sola consulta — restricció clau del rendiment dels LLM.

Què és la Finestra de Context?

La finestra de context és la quantitat màxima de text (mesurada en tokens) que un model d'IA pot «veure» simultàniament — incloent tant l'entrada (prompt, documents, historial de conversa) com la sortida generada.

Mides de la finestra de context

Els models 2024-2026 ofereixen finestres cada cop més grans: GPT-4o — 128K tokens (~300 pàgines de text), Claude — 200K tokens, Gemini — fins a 2M tokens. Malgrat això, la finestra de context segueix sent una restricció: més text implica major cost, major latència i potencialment pitjor qualitat.

Estratègies de gestió de context

En sistemes empresarials, la gestió intel·ligent de la finestra de context és clau: RAG (proporcioneu només fragments rellevants, no documents sencers), compressió de context (resum de l'historial de conversa), jerarquia d'agents (cada agent opera sobre el seu propi context més petit) i sistemes de memòria (memòria persistent fora de la finestra de context).