Atpakaļ uz vārdnīcu Tehnoloģija

RAG (Retrieval-Augmented Generation)

Tehnika, kas apvieno informācijas izgūšanu ar ģenerēšanu — MI atbild, balstoties uz aktuāliem dokumentiem, ne tikai savu "atmiņu."

Kas ir RAG?

Retrieval-Augmented Generation (RAG) apvieno divus posmus: izgūšanu (atbilstošu dokumentu atrašana zināšanu bāzē) un ģenerēšanu (atbilžu ģenerēšana, balstoties uz atrastajiem materiāliem). Modelis nepaļaujas uz apmācības atmiņu, bet uz nodrošinātiem, aktuāliem datiem.

Kā darbojas RAG cauruļvads?

1. Lietotājs uzdod jautājumu. 2. Sistēma meklē atbilstošus dokumentu fragmentus vektoru datubāzē (embedding + līdzības meklēšana). 3. Atrastie fragmenti tiek pievienoti uzvedne kā konteksts. 4. Modelis ģenerē atbildi, atsaucoties uz avotiem.

RAG pret fine-tuning

Izmantojiet RAG, ja dati mainās (zināšanu bāze, dokumentācija, noteikumi). Izmantojiet fine-tuning, ja vēlaties mainīt modeļa uzvedību (atbildes stils, formāts, nozares specializācija). Biznesa praksē abas pieejas parasti tiek kombinētas.

Saistītie pakalpojumi un produkti