Povratak na rječnik Tehnologija

Kontekstualni prozor

Maksimalna količina teksta (tokena) koju AI model može obraditi u jednom upitu — ključno ograničenje performansi LLM-a.

Što je kontekstualni prozor?

Kontekstualni prozor je maksimalna količina teksta (mjerena u tokenima) koju AI model može "vidjeti" istovremeno — uključujući i ulaz (prompt, dokumenti, povijest razgovora) i generirani izlaz.

Veličine kontekstualnog prozora

Modeli iz 2024.-2026. nude sve veće prozore: GPT-4o — 128K tokena (~300 stranica teksta), Claude — 200K tokena, Gemini — do 2M tokena. Unatoč tome, kontekstualni prozor ostaje ograničenje: više teksta znači veći trošak, veću latenciju i potencijalno lošiju kvalitetu.

Strategije upravljanja kontekstom

U poslovnim sustavima, pametno upravljanje kontekstualnim prozorom je ključno: RAG (pružite samo relevantne fragmente, ne cijele dokumente), kompresija konteksta (sažimanje povijesti razgovora), hijerarhija agenata (svaki agent radi na svom manjem kontekstu) i sustavi memorije (trajna memorija izvan kontekstualnog prozora).