Kas yra RAG?
Retrieval-Augmented Generation (RAG) derina du etapus: paiešką (susijusių dokumentų radimas žinių bazėje) ir generavimą (atsakymų generavimas remiantis rastais materiālais). Modelis nesiremia mokymo atmintimi, bet pateiktais, aktualiais duomenimis.
Kaip veikia RAG konvejeris?
1. Vartotojas užduoda klausimą. 2. Sistema ieško susijusių dokumentų fragmentų vektorinėje duomenų bazėje (embedding + panašumo paieška). 3. Rasti fragmentai pridedami prie raginimo kaip kontekstas. 4. Modelis sugeneruoja atsakymą, nurodydamas šaltinius.
RAG ir fine-tuning
Naudokite RAG, kai duomenys keičiasi (žinių bazė, dokumentacija, reglamentai). Naudokite fine-tuningą, kai norite pakeisti modelio elgseną (atsakymo stilių, formatą, srities specializaciją). Verslo praktikoje dažniausiai derinami abu metodai.