RAG (Retrieval-Augmented Generation)

Que é RAG?

Retrieval-Augmented Generation (RAG) combina dúas etapas: recuperación (atopar documentos relevantes dunha base de coñecemento) e xeración (xerar respostas baseadas nos materiais atopados). O modelo non se basea na memoria de adestramento senón en datos actuais proporcionados.

Como funciona un pipeline RAG?

1. O usuario fai unha pregunta. 2. O sistema busca fragmentos de documentos relevantes nunha base de datos vectorial (embedding + busca de similitude). 3. Os fragmentos atopados engádense ao prompt como contexto. 4. O modelo xera unha resposta citando fontes.

RAG vs fine-tuning

Usade RAG cando os datos cambian (base de coñecemento, documentación, normativas). Usade fine-tuning cando queirades cambiar o comportamento do modelo (estilo de resposta, formato, especialización do dominio). Na práctica empresarial, habitualmente combínanse ambos enfoques.

Que é RAG?

Como funciona un pipeline RAG?

RAG vs fine-tuning

Termos relacionados

Servizos e produtos relacionados