Što je RAG?
Retrieval-Augmented Generation (RAG) kombinira dvije faze: dohvaćanje (pronalaženje relevantnih dokumenata iz baze znanja) i generiranje (generiranje odgovora na temelju pronađenih materijala). Model se ne oslanja na sjećanje iz treniranja, nego na pružene, aktualne podatke.
Kako funkcionira RAG cjevovod?
1. Korisnik postavlja pitanje. 2. Sustav pretražuje relevantne fragmente dokumenata u vektorskoj bazi podataka (embedding + pretraživanje sličnosti). 3. Pronađeni fragmenti dodaju se u prompt kao kontekst. 4. Model generira odgovor navodeći izvore.
RAG vs fine-tuning
Koristite RAG kada se podaci mijenjaju (baza znanja, dokumentacija, propisi). Koristite fine-tuning kada želite promijeniti ponašanje modela (stil odgovora, format, domenska specijalizacija). U poslovnoj praksi, oba pristupa se obično kombiniraju.