Vissza a szójegyzékhez Technológia

RAG (Retrieval-Augmented Generation)

Információ-visszakeresést és generálást kombináló technika — az AI aktuális dokumentumok alapján válaszol, nem csak az „emlékezetéből".

Mi a RAG?

A Retrieval-Augmented Generation (RAG) két fázist kombinál: keresés (releváns dokumentumok megtalálása a tudásbázisban) és generálás (válaszok generálása a talált anyagok alapján). A modell nem a betanítási emlékezetére támaszkodik, hanem a megadott aktuális adatokra.

Hogyan működik a RAG-folyamat?

1. A felhasználó feltesz egy kérdést. 2. A rendszer releváns dokumentumrészleteket keres a vektoradatbázisban (embedding + hasonlósági keresés). 3. A talált részleteket kontextusként beilleszti a promptba. 4. A modell forrásokat idéző választ generál.

RAG vs fine-tuning

Használjon RAG-ot, ha az adatok változnak (tudásbázis, dokumentáció, szabályozások). Használjon fine-tuningot, ha a modell viselkedését kívánja megváltoztatni (válaszstílus, formátum, szakterületi specializáció). A vállalati gyakorlatban általában mindkét megközelítést kombinálják.

Kapcsolódó szolgáltatások és termékek