Обратно към речника Технологии

Контекстов прозорец

Максималното количество текст (токени), което AI модел може да обработи в една заявка — ключово ограничение на производителността на LLM.

Какво е контекстов прозорец?

Контекстовият прозорец е максималното количество текст (измерено в токени), което AI моделът може да „види“ едновременно — включващо както входа (промпт, документи, история на разговора), така и генерирания изход.

Размери на контекстовите прозорци

Моделите от 2024–2026 г. предлагат все по-големи прозорци: GPT-4o — 128K токена (~300 страници текст), Claude — 200K токена, Gemini — до 2M токена. Въпреки това контекстовият прозорец остава ограничение: повече текст означава по-високи разходи, по-голяма латентност и потенциално по-лошо качество.

Стратегии за управление на контекста

В корпоративните системи интелигентното управление на контекстовия прозорец е ключово: RAG (предоставяйте само релевантни фрагменти, не цели документи), компресия на контекста (обобщаване на историята на разговора), йерархия на агенти (всеки агент работи със собствен по-малък контекст) и системи за памет (постоянна памет извън контекстовия прозорец).