Que é RAG?
Retrieval-Augmented Generation (RAG) combina dúas etapas: recuperación (atopar documentos relevantes dunha base de coñecemento) e xeración (xerar respostas baseadas nos materiais atopados). O modelo non se basea na memoria de adestramento senón en datos actuais proporcionados.
Como funciona un pipeline RAG?
1. O usuario fai unha pregunta. 2. O sistema busca fragmentos de documentos relevantes nunha base de datos vectorial (embedding + busca de similitude). 3. Os fragmentos atopados engádense ao prompt como contexto. 4. O modelo xera unha resposta citando fontes.
RAG vs fine-tuning
Usade RAG cando os datos cambian (base de coñecemento, documentación, normativas). Usade fine-tuning cando queirades cambiar o comportamento do modelo (estilo de resposta, formato, especialización do dominio). Na práctica empresarial, habitualmente combínanse ambos enfoques.