¿Qué es una ventana de contexto?
Una ventana de contexto es la cantidad máxima de texto (medida en tokens) que un modelo de IA puede «ver» simultáneamente — incluyendo la entrada (prompt, documentos, historial de conversación) y la salida generada.
Tamaños de ventana de contexto
Los modelos de 2024–2026 ofrecen ventanas cada vez mayores: GPT-4o — 128K tokens (~300 páginas de texto), Claude — 200K tokens, Gemini — hasta 2M tokens. A pesar de ello, la ventana de contexto sigue siendo una limitación: más texto significa mayor coste, mayor latencia y potencialmente peor calidad.
Estrategias de gestión del contexto
En sistemas empresariales, la gestión inteligente de la ventana de contexto es clave: RAG (proporcionar solo fragmentos relevantes, no documentos enteros), compresión de contexto (resumen del historial de conversación), jerarquía de agentes (cada agente opera con su propio contexto más pequeño) y sistemas de memoria (memoria persistente fuera de la ventana de contexto).