Vad är RAG?
Retrieval-Augmented Generation (RAG) kombinerar två steg: retrieval (hitta relevanta dokument från en kunskapsbas) och generation (generera svar baserat på hittade material). Modellen förlitar sig inte på träningsminne utan på tillhandahållen, aktuell data.
Hur fungerar en RAG-pipeline?
1. Användaren ställer en fråga. 2. Systemet söker efter relevanta dokumentfragment i en vektordatabas (embedding + likhetssökning). 3. Hittade fragment läggs till i prompten som kontext. 4. Modellen genererar ett svar med källhänvisningar.
RAG vs fine-tuning
Använd RAG när data förändras (kunskapsbas, dokumentation, regelverk). Använd fine-tuning när du vill ändra modellens beteende (svarsstil, format, domänspecialisering). I företagspraktiken kombineras vanligtvis båda tillvägagångssätten.