Mis on kontekstiaken?
Kontekstiaken on maksimaalne teksti hulk (mõõdetuna tokenites), mida tehisintellekti mudel suudab korraga "näha" — sealhulgas nii sisend (viip, dokumendid, vestlusajalugu) kui ka genereeritud väljund.
Kontekstiakna suurused
2024–2026 mudelid pakuvad üha suuremaid aknaid: GPT-4o — 128K tokenit (~300 lehekülge teksti), Claude — 200K tokenit, Gemini — kuni 2M tokenit. Sellest hoolimata jääb kontekstiaken piiranguteks: rohkem teksti tähendab suuremat kulu, pikemat latentsust ja potentsiaalselt halvemat kvaliteeti.
Konteksti haldamise strateegiad
Ärisüsteemides on nutikas kontekstiakna haldamine võtmetähtsusega: RAG (pakkuge ainult asjakohaseid fragmente, mitte terveid dokumente), konteksti kompressioon (vestlusajaloo kokkuvõtmine), agentide hierarhia (iga agent töötab oma väiksema kontekstiga) ja mälusüsteemid (püsiv mälu väljaspool kontekstiakent).