Voltar ao glossário Tecnologia

Janela de contexto

Quantidade máxima de texto (tokens) que um modelo de IA pode processar numa única consulta — uma limitação-chave do desempenho dos LLM.

O que é uma janela de contexto?

Uma janela de contexto é a quantidade máxima de texto (medida em tokens) que um modelo de IA pode «ver» simultaneamente — incluindo a entrada (prompt, documentos, histórico de conversação) e a saída gerada.

Tamanhos das janelas de contexto

Os modelos de 2024–2026 oferecem janelas cada vez maiores: GPT-4o — 128K tokens (~300 páginas de texto), Claude — 200K tokens, Gemini — até 2M tokens. Apesar disso, a janela de contexto continua a ser uma limitação: mais texto significa custo mais elevado, maior latência e qualidade potencialmente inferior.

Estratégias de gestão de contexto

Nos sistemas empresariais, a gestão inteligente da janela de contexto é fundamental: RAG (fornecer apenas fragmentos relevantes, não documentos inteiros), compressão de contexto (resumo do histórico de conversação), hierarquia de agentes (cada agente opera com o seu próprio contexto mais pequeno) e sistemas de memória (memória persistente fora da janela de contexto).