Takaisin sanastoon Teknologia

RAG (Retrieval-Augmented Generation)

Tekniikka, joka yhdistää tiedonhaun generointiin — tekoäly vastaa ajantasaisten dokumenttien perusteella, ei pelkästään "muistinsa" varassa.

Mitä on RAG?

Retrieval-Augmented Generation (RAG) yhdistää kaksi vaihetta: retrieval (relevanttien dokumenttien hakeminen tietokannasta) ja generation (vastausten generointi löydetyn materiaalin perusteella). Malli ei luota koulutusmuistiinsa vaan tarjottuun, ajantasaiseen dataan.

Miten RAG-putkisto toimii?

1. Käyttäjä esittää kysymyksen. 2. Järjestelmä etsii relevantteja dokumenttifragmentteja vektoritietokannasta (embedding + samankaltaisuushaku). 3. Löydetyt fragmentit lisätään promptiin kontekstiksi. 4. Malli generoi vastauksen lähteitä viitaten.

RAG vs fine-tuning

Käytä RAG:ia, kun data muuttuu (tietokanta, dokumentaatio, säädökset). Käytä fine-tuningia, kun haluat muuttaa mallin käyttäytymistä (vastaustyyliä, muotoa, toimialaerikoistumista). Yrityskäytännössä molempia lähestymistapoja yleensä yhdistetään.