Czym jest RAG?
Retrieval-Augmented Generation (RAG) to architektura łącząca dwa etapy: retrieval (wyszukanie relevantnych dokumentów z bazy wiedzy) i generation (wygenerowanie odpowiedzi na podstawie znalezionych materiałów). Model nie polega na pamięci ze zbioru treningowego, ale na dostarczonych, aktualnych danych.
Jak działa pipeline RAG?
1. Użytkownik zadaje pytanie. 2. System wyszukuje relevantne fragmenty dokumentów w bazie wektorowej (embedding + similarity search). 3. Znalezione fragmenty trafiają do promptu jako kontekst. 4. Model generuje odpowiedź, cytując źródła. Kluczowa jakość RAG zależy od: jakości embeddingów, strategii chunking dokumentów i rerankingu wyników.
RAG vs fine-tuning
RAG stosujemy, gdy dane się zmieniają (baza wiedzy, dokumentacja, regulaminy). Fine-tuning stosujemy, gdy chcemy zmienić zachowanie modelu (styl odpowiedzi, format, specjalizacja domenowa). W praktyce enterprise najczęściej łączy się oba podejścia.