Späť na slovník Technológie

RAG (Retrieval-Augmented Generation)

Technika kombinujúca vyhľadávanie informácií s generovaním — AI odpovedá na základe aktuálnych dokumentov, nielen svojej „pamäte".

Čo je RAG?

Retrieval-Augmented Generation (RAG) kombinuje dve fázy: retrieval (vyhľadanie relevantných dokumentov zo znalostnej bázy) a generation (generovanie odpovedí na základe nájdených materiálov). Model sa nespolieha na trénovaciu pamäť, ale na poskytnuté aktuálne dáta.

Ako funguje RAG pipeline?

1. Používateľ položí otázku. 2. Systém vyhľadá relevantné fragmenty dokumentov vo vektorovej databáze (embedding + vyhľadávanie podobnosti). 3. Nájdené fragmenty sa pridajú do promptu ako kontext. 4. Model vygeneruje odpoveď s citáciami zdrojov.

RAG vs fine-tuning

Použite RAG, keď sa dáta menia (znalostná báza, dokumentácia, predpisy). Použite fine-tuning, keď chcete zmeniť správanie modelu (štýl odpovedí, formát, doménová špecializácia). V podnikovej praxi sa obvykle kombinujú oba prístupy.

Súvisiace služby a produkty