Späť na slovník Technológie

LLM Routing

Inteligentné smerovanie dotazov na správny jazykový model podľa zložitosti, nákladov a požadovanej kvality odpovede.

Čo je LLM Routing?

LLM Routing je technika automatického smerovania dotazov na najvhodnejší AI model podľa zložitosti úlohy, požadovanej kvality a rozpočtu. Namiesto odosielania každého dotazu na najdrahší model router analyzuje obsah a vyberie optimálny cieľ.

Ako funguje viacúrovňové smerovanie?

Systém klasifikuje prichádzajúce dotazy a smeruje ich na príslušnú úroveň. Jednoduché otázky FAQ smerujú na rýchle, lacné modely. Úlohy strednej zložitosti spracúvajú modely strednej úrovne. Iba skutočne zložité problémy vyžadujúce hlboké uvažovanie sa dostanú k najdrahším prémiovým modelom.

Úspora nákladov

Viacúrovňové smerovanie môže znížiť náklady na API o 60–80 % bez straty kvality. Kľúčom je správna klasifikácia — systém musí rozpoznať, že „aké je počasie?" nevyžaduje rovnaký model ako „pripravte analýzu due diligence".