Tagasi sõnastikku Tehnoloogia

Kontekstiaken

Maksimaalne teksti (tokenite) hulk, mida tehisintellekti mudel suudab ühes päringus töödelda — LLM-i jõudluse võtmepiirang.

Mis on kontekstiaken?

Kontekstiaken on maksimaalne teksti hulk (mõõdetuna tokenites), mida tehisintellekti mudel suudab korraga "näha" — sealhulgas nii sisend (viip, dokumendid, vestlusajalugu) kui ka genereeritud väljund.

Kontekstiakna suurused

2024–2026 mudelid pakuvad üha suuremaid aknaid: GPT-4o — 128K tokenit (~300 lehekülge teksti), Claude — 200K tokenit, Gemini — kuni 2M tokenit. Sellest hoolimata jääb kontekstiaken piiranguteks: rohkem teksti tähendab suuremat kulu, pikemat latentsust ja potentsiaalselt halvemat kvaliteeti.

Konteksti haldamise strateegiad

Ärisüsteemides on nutikas kontekstiakna haldamine võtmetähtsusega: RAG (pakkuge ainult asjakohaseid fragmente, mitte terveid dokumente), konteksti kompressioon (vestlusajaloo kokkuvõtmine), agentide hierarhia (iga agent töötab oma väiksema kontekstiga) ja mälusüsteemid (püsiv mälu väljaspool kontekstiakent).