Ce este RAG?
Retrieval-Augmented Generation (RAG) combină două etape: recuperare (găsirea documentelor relevante din baza de cunoștințe) și generare (generarea răspunsurilor pe baza materialelor găsite). Modelul nu se bazează pe memoria de antrenament, ci pe datele actuale furnizate.
Cum funcționează un pipeline RAG?
1. Utilizatorul pune o întrebare. 2. Sistemul caută fragmente relevante de documente într-o bază de date vectorială (embedding + căutare de similaritate). 3. Fragmentele găsite sunt adăugate în prompt ca context. 4. Modelul generează un răspuns cu citarea surselor.
RAG vs fine-tuning
Utilizați RAG când datele se schimbă (bază de cunoștințe, documentație, reglementări). Utilizați fine-tuning când doriți să schimbați comportamentul modelului (stilul răspunsurilor, formatul, specializarea de domeniu). În practica enterprise, ambele abordări sunt de obicei combinate.