Mis on RAG?
Retrieval-Augmented Generation (RAG) ühendab kaks etappi: otsimine (asjakohaste dokumentide leidmine teadmusbaasist) ja genereerimine (vastuste genereerimine leitud materjalide põhjal). Mudel ei toetu treeningmälule, vaid pakutud, ajakohastele andmetele.
Kuidas RAG-i toruliini töötab?
1. Kasutaja esitab küsimuse. 2. Süsteem otsib vektorandmebaasist asjakohaseid dokumendifragmente (embedding + sarnasuse otsing). 3. Leitud fragmendid lisatakse viibasse kontekstina. 4. Mudel genereerib vastuse, viidates allikatele.
RAG vs fine-tuning
Kasutage RAG-i, kui andmed muutuvad (teadmusbaas, dokumentatsioon, eeskirjad). Kasutage fine-tuningut, kui soovite muuta mudeli käitumist (vastuse stiil, formaat, valdkonna spetsialiseerumine). Äripraktikas kombineeritakse tavaliselt mõlemat lähenemist.