Какво е RAG?
Retrieval-Augmented Generation (RAG) комбинира два етапа: извличане (намиране на релевантни документи от базата знания) и генериране (генериране на отговори въз основа на намерените материали). Моделът не разчита на паметта от обучение, а на предоставените актуални данни.
Как работи RAG тръбопроводът?
1. Потребителят задава въпрос. 2. Системата търси релевантни фрагменти от документи във векторна база данни (embedding + търсене по сходство). 3. Намерените фрагменти се добавят към промпта като контекст. 4. Моделът генерира отговор с цитиране на източници.
RAG vs fine-tuning
Използвайте RAG, когато данните се променят (база знания, документация, нормативна уредба). Използвайте fine-tuning, когато искате да промените поведението на модела (стил на отговори, формат, домейнна специализация). В корпоративната практика обикновено се комбинират и двата подхода.