Обратно към речника Технологии

RAG (Retrieval-Augmented Generation)

Техника, комбинираща извличане на информация с генериране — AI отговаря въз основа на актуални документи, а не само на „паметта“ си.

Какво е RAG?

Retrieval-Augmented Generation (RAG) комбинира два етапа: извличане (намиране на релевантни документи от базата знания) и генериране (генериране на отговори въз основа на намерените материали). Моделът не разчита на паметта от обучение, а на предоставените актуални данни.

Как работи RAG тръбопроводът?

1. Потребителят задава въпрос. 2. Системата търси релевантни фрагменти от документи във векторна база данни (embedding + търсене по сходство). 3. Намерените фрагменти се добавят към промпта като контекст. 4. Моделът генерира отговор с цитиране на източници.

RAG vs fine-tuning

Използвайте RAG, когато данните се променят (база знания, документация, нормативна уредба). Използвайте fine-tuning, когато искате да промените поведението на модела (стил на отговори, формат, домейнна специализация). В корпоративната практика обикновено се комбинират и двата подхода.

Свързани услуги и продукти