Zpět na slovník Technologie

LLM Routing

Inteligentní směrování dotazů na správný jazykový model podle složitosti, nákladů a požadované kvality odpovědi.

Co je LLM Routing?

LLM Routing je technika automatického směrování dotazů na nejvhodnější AI model podle složitosti úlohy, požadované kvality a rozpočtu. Místo odesílání každého dotazu na nejdražší model router analyzuje obsah a vybere optimální cíl.

Jak funguje víceúrovňové směrování?

Systém klasifikuje příchozí dotazy a směruje je na příslušnou úroveň. Jednoduché otázky FAQ směřují na rychlé, levné modely. Úlohy střední složitosti zpracovávají modely střední úrovně. Pouze skutečně složité problémy vyžadující hluboké uvažování se dostanou k nejdražším prémiovým modelům.

Úspora nákladů

Víceúrovňové směrování může snížit náklady na API o 60–80 % bez ztráty kvality. Klíčem je správná klasifikace — systém musí rozpoznat, že „jaké je počasí?" nevyžaduje stejný model jako „připravte analýzu due diligence".