Grįžti į žodyną Technologijos

RAG (Retrieval-Augmented Generation)

Technika, derinanti informacijos paiešką su generavimu — DI atsako remdamasis aktualiais dokumentais, o ne vien savo "atmintimi."

Kas yra RAG?

Retrieval-Augmented Generation (RAG) derina du etapus: paiešką (susijusių dokumentų radimas žinių bazėje) ir generavimą (atsakymų generavimas remiantis rastais materiālais). Modelis nesiremia mokymo atmintimi, bet pateiktais, aktualiais duomenimis.

Kaip veikia RAG konvejeris?

1. Vartotojas užduoda klausimą. 2. Sistema ieško susijusių dokumentų fragmentų vektorinėje duomenų bazėje (embedding + panašumo paieška). 3. Rasti fragmentai pridedami prie raginimo kaip kontekstas. 4. Modelis sugeneruoja atsakymą, nurodydamas šaltinius.

RAG ir fine-tuning

Naudokite RAG, kai duomenys keičiasi (žinių bazė, dokumentacija, reglamentai). Naudokite fine-tuningą, kai norite pakeisti modelio elgseną (atsakymo stilių, formatą, srities specializaciją). Verslo praktikoje dažniausiai derinami abu metodai.

Susijusios paslaugos ir produktai