Què és RAG?
Retrieval-Augmented Generation (RAG) combina dues etapes: recuperació (trobar documents rellevants d'una base de coneixement) i generació (generar respostes basades en els materials trobats). El model no es basa en la memòria d'entrenament sinó en dades actuals proporcionades.
Com funciona un pipeline RAG?
1. L'usuari fa una pregunta. 2. El sistema cerca fragments de documents rellevants en una base de dades vectorial (embedding + cerca de similitud). 3. Els fragments trobats s'afegeixen al prompt com a context. 4. El model genera una resposta citant fonts.
RAG vs fine-tuning
Utilitzeu RAG quan les dades canvien (base de coneixement, documentació, normatives). Utilitzeu fine-tuning quan voleu canviar el comportament del model (estil de resposta, format, especialització del domini). A la pràctica empresarial, habitualment es combinen ambdós enfocaments.