Povratak na rječnik Tehnologija

LLM Routing

Inteligentno usmjeravanje upita na odgovarajući jezični model na temelju složenosti, troškova i potrebne kvalitete odgovora.

Što je LLM Routing?

LLM Routing je tehnika automatskog usmjeravanja upita na najprikladniji AI model na temelju složenosti zadatka, potrebne kvalitete i proračuna. Umjesto slanja svakog upita na najskuplji model, usmjerivač analizira sadržaj i odabire optimalan cilj.

Kako funkcionira višerazinsko usmjeravanje?

Sustav klasificira dolazne upite i usmjerava ih na odgovarajuću razinu. Jednostavna FAQ pitanja idu na brze, jeftine modele. Zadaci srednje složenosti obrađuju se modelima srednje razine. Samo uistinu složeni problemi koji zahtijevaju duboko zaključivanje stižu do najskupljih premium modela.

Uštede troškova

Višerazinsko usmjeravanje može smanjiti troškove API-ja za 60-80% bez gubitka kvalitete. Ključna je ispravna klasifikacija — sustav mora prepoznati da "kakvo je vrijeme?" ne zahtijeva isti model kao "pripremite analizu dubinskog snimanja."