Kaj je RAG?
Retrieval-Augmented Generation (RAG) združuje dve fazi: iskanje (iskanje ustreznih dokumentov iz baze znanja) in generiranje (generiranje odgovorov na podlagi najdenih materialov). Model se ne zanaša na učni spomin, temveč na zagotovljene, aktualne podatke.
Kako deluje cevovod RAG?
1. Uporabnik postavi vprašanje. 2. Sistem v vektorski podatkovni bazi poišče ustrezne fragmente dokumentov (embedding + iskanje po podobnosti). 3. Najdeni fragmenti se dodajo v poziv kot kontekst. 4. Model ustvari odgovor z navedbo virov.
RAG vs fine-tuning
Uporabite RAG, ko se podatki spreminjajo (baza znanja, dokumentacija, predpisi). Uporabite fine-tuning, ko želite spremeniti vedenje modela (slog odgovorov, obliko, domensko specializacijo). V poslovni praksi se običajno kombinirata oba pristopa.