Cos'è una finestra di contesto?
Una finestra di contesto è la quantità massima di testo (misurata in token) che un modello IA può «vedere» simultaneamente — includendo sia l'input (prompt, documenti, cronologia della conversazione) che l'output generato.
Dimensioni delle finestre di contesto
I modelli 2024–2026 offrono finestre sempre più ampie: GPT-4o — 128K token (~300 pagine di testo), Claude — 200K token, Gemini — fino a 2M token. Nonostante ciò, la finestra di contesto rimane un vincolo: più testo significa costi maggiori, latenza più elevata e qualità potenzialmente inferiore.
Strategie di gestione del contesto
Nei sistemi aziendali, la gestione intelligente della finestra di contesto è fondamentale: RAG (fornire solo i frammenti rilevanti, non documenti interi), compressione del contesto (riassunto della cronologia della conversazione), gerarchia di agenti (ogni agente opera con il proprio contesto più piccolo) e sistemi di memoria (memoria persistente al di fuori della finestra di contesto).