RAG (Retrieval-Augmented Generation)

Vad är RAG?

Retrieval-Augmented Generation (RAG) kombinerar två steg: retrieval (hitta relevanta dokument från en kunskapsbas) och generation (generera svar baserat på hittade material). Modellen förlitar sig inte på träningsminne utan på tillhandahållen, aktuell data.

Hur fungerar en RAG-pipeline?

1. Användaren ställer en fråga. 2. Systemet söker efter relevanta dokumentfragment i en vektordatabas (embedding + likhetssökning). 3. Hittade fragment läggs till i prompten som kontext. 4. Modellen genererar ett svar med källhänvisningar.

RAG vs fine-tuning

Använd RAG när data förändras (kunskapsbas, dokumentation, regelverk). Använd fine-tuning när du vill ändra modellens beteende (svarsstil, format, domänspecialisering). I företagspraktiken kombineras vanligtvis båda tillvägagångssätten.

Vad är RAG?

Hur fungerar en RAG-pipeline?

RAG vs fine-tuning

Relaterade termer

Relaterade tjänster och produkter