RAG (Retrieval-Augmented Generation)

Mis on RAG?

Retrieval-Augmented Generation (RAG) ühendab kaks etappi: otsimine (asjakohaste dokumentide leidmine teadmusbaasist) ja genereerimine (vastuste genereerimine leitud materjalide põhjal). Mudel ei toetu treeningmälule, vaid pakutud, ajakohastele andmetele.

Kuidas RAG-i toruliini töötab?

1. Kasutaja esitab küsimuse. 2. Süsteem otsib vektorandmebaasist asjakohaseid dokumendifragmente (embedding + sarnasuse otsing). 3. Leitud fragmendid lisatakse viibasse kontekstina. 4. Mudel genereerib vastuse, viidates allikatele.

RAG vs fine-tuning

Kasutage RAG-i, kui andmed muutuvad (teadmusbaas, dokumentatsioon, eeskirjad). Kasutage fine-tuningut, kui soovite muuta mudeli käitumist (vastuse stiil, formaat, valdkonna spetsialiseerumine). Äripraktikas kombineeritakse tavaliselt mõlemat lähenemist.

Mis on RAG?

Kuidas RAG-i toruliini töötab?

RAG vs fine-tuning

Seotud mõisted

Seotud teenused ja tooted