Povratak na rječnik Tehnologija

RAG (Retrieval-Augmented Generation)

Tehnika koja kombinira dohvaćanje informacija s generiranjem — AI odgovara na temelju aktualnih dokumenata, a ne samo svog "sjećanja."

Što je RAG?

Retrieval-Augmented Generation (RAG) kombinira dvije faze: dohvaćanje (pronalaženje relevantnih dokumenata iz baze znanja) i generiranje (generiranje odgovora na temelju pronađenih materijala). Model se ne oslanja na sjećanje iz treniranja, nego na pružene, aktualne podatke.

Kako funkcionira RAG cjevovod?

1. Korisnik postavlja pitanje. 2. Sustav pretražuje relevantne fragmente dokumenata u vektorskoj bazi podataka (embedding + pretraživanje sličnosti). 3. Pronađeni fragmenti dodaju se u prompt kao kontekst. 4. Model generira odgovor navodeći izvore.

RAG vs fine-tuning

Koristite RAG kada se podaci mijenjaju (baza znanja, dokumentacija, propisi). Koristite fine-tuning kada želite promijeniti ponašanje modela (stil odgovora, format, domenska specijalizacija). U poslovnoj praksi, oba pristupa se obično kombiniraju.