Volver ao glosario Tecnoloxía

RAG (Retrieval-Augmented Generation)

Técnica que combina a recuperación de información coa xeración — a IA responde baseándose en documentos actuais, non só na súa «memoria».

Que é RAG?

Retrieval-Augmented Generation (RAG) combina dúas etapas: recuperación (atopar documentos relevantes dunha base de coñecemento) e xeración (xerar respostas baseadas nos materiais atopados). O modelo non se basea na memoria de adestramento senón en datos actuais proporcionados.

Como funciona un pipeline RAG?

1. O usuario fai unha pregunta. 2. O sistema busca fragmentos de documentos relevantes nunha base de datos vectorial (embedding + busca de similitude). 3. Os fragmentos atopados engádense ao prompt como contexto. 4. O modelo xera unha resposta citando fontes.

RAG vs fine-tuning

Usade RAG cando os datos cambian (base de coñecemento, documentación, normativas). Usade fine-tuning cando queirades cambiar o comportamento do modelo (estilo de resposta, formato, especialización do dominio). Na práctica empresarial, habitualmente combínanse ambos enfoques.