Čo je RAG?
Retrieval-Augmented Generation (RAG) kombinuje dve fázy: retrieval (vyhľadanie relevantných dokumentov zo znalostnej bázy) a generation (generovanie odpovedí na základe nájdených materiálov). Model sa nespolieha na trénovaciu pamäť, ale na poskytnuté aktuálne dáta.
Ako funguje RAG pipeline?
1. Používateľ položí otázku. 2. Systém vyhľadá relevantné fragmenty dokumentov vo vektorovej databáze (embedding + vyhľadávanie podobnosti). 3. Nájdené fragmenty sa pridajú do promptu ako kontext. 4. Model vygeneruje odpoveď s citáciami zdrojov.
RAG vs fine-tuning
Použite RAG, keď sa dáta menia (znalostná báza, dokumentácia, predpisy). Použite fine-tuning, keď chcete zmeniť správanie modelu (štýl odpovedí, formát, doménová špecializácia). V podnikovej praxi sa obvykle kombinujú oba prístupy.