Que é a Ventá de Contexto?
A ventá de contexto é a cantidade máxima de texto (medida en tokens) que un modelo de IA pode «ver» simultaneamente — incluíndo tanto a entrada (prompt, documentos, historial de conversa) como a saída xerada.
Tamaños da ventá de contexto
Os modelos 2024-2026 ofrecen ventás cada vez maiores: GPT-4o — 128K tokens (~300 páxinas de texto), Claude — 200K tokens, Gemini — ata 2M tokens. A pesar diso, a ventá de contexto segue sendo unha restrición: máis texto implica maior custo, maior latencia e potencialmente peor calidade.
Estratexias de xestión de contexto
En sistemas empresariais, a xestión intelixente da ventá de contexto é clave: RAG (proporcionade só fragmentos relevantes, non documentos enteiros), compresión de contexto (resumo do historial de conversa), xerarquía de axentes (cada axente opera sobre o seu propio contexto máis pequeno) e sistemas de memoria (memoria persistente fóra da ventá de contexto).