Was ist RAG?
Retrieval-Augmented Generation (RAG) kombiniert zwei Stufen: Retrieval (Suche relevanter Dokumente aus einer Wissensdatenbank) und Generation (Generierung von Antworten basierend auf gefundenen Materialien). Das Modell verlässt sich nicht auf sein Trainingsgedächtnis, sondern auf bereitgestellte, aktuelle Daten.
Wie funktioniert eine RAG-Pipeline?
1. Der Benutzer stellt eine Frage. 2. Das System sucht relevante Dokumentfragmente in einer Vektordatenbank (Embedding + Ähnlichkeitssuche). 3. Gefundene Fragmente werden dem Prompt als Kontext hinzugefügt. 4. Das Modell generiert eine Antwort unter Angabe von Quellen.
RAG vs. Fine-tuning
Verwenden Sie RAG, wenn sich Daten ändern (Wissensdatenbank, Dokumentation, Vorschriften). Verwenden Sie Fine-tuning, wenn Sie das Verhalten des Modells ändern möchten (Antwortstil, Format, Domänenspezialisierung). In der Unternehmenspraxis werden meist beide Ansätze kombiniert.