Hvad er RAG?
Retrieval-Augmented Generation (RAG) kombinerer to faser: retrieval (find relevante dokumenter fra en vidensbase) og generation (generer svar baseret på fundet materiale). Modellen stoler ikke på træningshukommelse, men på leveret, aktuel data.
Hvordan fungerer en RAG-pipeline?
1. Brugeren stiller et spørgsmål. 2. Systemet søger efter relevante dokumentfragmenter i en vektordatabase (embedding + lighedssøgning). 3. Fundne fragmenter tilføjes prompten som kontekst. 4. Modellen genererer et svar med kildehenvisninger.
RAG vs fine-tuning
Brug RAG, når data ændrer sig (vidensbase, dokumentation, regler). Brug fine-tuning, når du vil ændre modellens adfærd (svarstil, format, domænespecialisering). I virksomhedspraksis kombineres begge tilgange normalt.