Mitä on RAG?
Retrieval-Augmented Generation (RAG) yhdistää kaksi vaihetta: retrieval (relevanttien dokumenttien hakeminen tietokannasta) ja generation (vastausten generointi löydetyn materiaalin perusteella). Malli ei luota koulutusmuistiinsa vaan tarjottuun, ajantasaiseen dataan.
Miten RAG-putkisto toimii?
1. Käyttäjä esittää kysymyksen. 2. Järjestelmä etsii relevantteja dokumenttifragmentteja vektoritietokannasta (embedding + samankaltaisuushaku). 3. Löydetyt fragmentit lisätään promptiin kontekstiksi. 4. Malli generoi vastauksen lähteitä viitaten.
RAG vs fine-tuning
Käytä RAG:ia, kun data muuttuu (tietokanta, dokumentaatio, säädökset). Käytä fine-tuningia, kun haluat muuttaa mallin käyttäytymistä (vastaustyyliä, muotoa, toimialaerikoistumista). Yrityskäytännössä molempia lähestymistapoja yleensä yhdistetään.