Kas ir RAG?
Retrieval-Augmented Generation (RAG) apvieno divus posmus: izgūšanu (atbilstošu dokumentu atrašana zināšanu bāzē) un ģenerēšanu (atbilžu ģenerēšana, balstoties uz atrastajiem materiāliem). Modelis nepaļaujas uz apmācības atmiņu, bet uz nodrošinātiem, aktuāliem datiem.
Kā darbojas RAG cauruļvads?
1. Lietotājs uzdod jautājumu. 2. Sistēma meklē atbilstošus dokumentu fragmentus vektoru datubāzē (embedding + līdzības meklēšana). 3. Atrastie fragmenti tiek pievienoti uzvedne kā konteksts. 4. Modelis ģenerē atbildi, atsaucoties uz avotiem.
RAG pret fine-tuning
Izmantojiet RAG, ja dati mainās (zināšanu bāze, dokumentācija, noteikumi). Izmantojiet fine-tuning, ja vēlaties mainīt modeļa uzvedību (atbildes stils, formāts, nozares specializācija). Biznesa praksē abas pieejas parasti tiek kombinētas.