Volver ao glosario Tecnoloxía

Ventá de Contexto

Cantidade máxima de texto (tokens) que un modelo de IA pode procesar nunha soa consulta — restrición clave do rendemento dos LLM.

Que é a Ventá de Contexto?

A ventá de contexto é a cantidade máxima de texto (medida en tokens) que un modelo de IA pode «ver» simultaneamente — incluíndo tanto a entrada (prompt, documentos, historial de conversa) como a saída xerada.

Tamaños da ventá de contexto

Os modelos 2024-2026 ofrecen ventás cada vez maiores: GPT-4o — 128K tokens (~300 páxinas de texto), Claude — 200K tokens, Gemini — ata 2M tokens. A pesar diso, a ventá de contexto segue sendo unha restrición: máis texto implica maior custo, maior latencia e potencialmente peor calidade.

Estratexias de xestión de contexto

En sistemas empresariais, a xestión intelixente da ventá de contexto é clave: RAG (proporcionade só fragmentos relevantes, non documentos enteiros), compresión de contexto (resumo do historial de conversa), xerarquía de axentes (cada axente opera sobre o seu propio contexto máis pequeno) e sistemas de memoria (memoria persistente fóra da ventá de contexto).