Volver al glosario Tecnología

RAG (Retrieval-Augmented Generation)

Técnica que combina recuperación de información con generación — la IA responde basándose en documentos actuales, no solo en su «memoria».

¿Qué es RAG?

Retrieval-Augmented Generation (RAG) combina dos etapas: recuperación (búsqueda de documentos relevantes en una base de conocimiento) y generación (generación de respuestas basadas en los materiales encontrados). El modelo no se basa en su memoria de entrenamiento sino en datos actuales proporcionados.

¿Cómo funciona un pipeline RAG?

1. El usuario hace una pregunta. 2. El sistema busca fragmentos de documentos relevantes en una base de datos vectorial (embedding + búsqueda de similitud). 3. Los fragmentos encontrados se añaden al prompt como contexto. 4. El modelo genera una respuesta citando las fuentes.

RAG vs fine-tuning

Use RAG cuando los datos cambian (base de conocimiento, documentación, normativas). Use fine-tuning cuando quiera cambiar el comportamiento del modelo (estilo de respuesta, formato, especialización de dominio). En la práctica empresarial, ambos enfoques suelen combinarse.