Torna al glossario Tecnologia

Finestra di contesto

Quantità massima di testo (token) che un modello IA può elaborare in una singola query — un vincolo chiave delle prestazioni degli LLM.

Cos'è una finestra di contesto?

Una finestra di contesto è la quantità massima di testo (misurata in token) che un modello IA può «vedere» simultaneamente — includendo sia l'input (prompt, documenti, cronologia della conversazione) che l'output generato.

Dimensioni delle finestre di contesto

I modelli 2024–2026 offrono finestre sempre più ampie: GPT-4o — 128K token (~300 pagine di testo), Claude — 200K token, Gemini — fino a 2M token. Nonostante ciò, la finestra di contesto rimane un vincolo: più testo significa costi maggiori, latenza più elevata e qualità potenzialmente inferiore.

Strategie di gestione del contesto

Nei sistemi aziendali, la gestione intelligente della finestra di contesto è fondamentale: RAG (fornire solo i frammenti rilevanti, non documenti interi), compressione del contesto (riassunto della cronologia della conversazione), gerarchia di agenti (ogni agente opera con il proprio contesto più piccolo) e sistemi di memoria (memoria persistente al di fuori della finestra di contesto).