Zer da RAG?
Retrieval-Augmented Generation (RAG) bi etapa konbinatzen ditu: berreskurapena (dokumentu garrantzitsuak ezagutza-base batetik aurkitzea) eta sorkuntza (aurkitutako materialetan oinarritutako erantzunak sortzea). Ereduak ez du entrenatze-oroimen gisa erabiltzen, emandako datu eguneratuak baizik.
Nola funtzionatzen du RAG pipeline batek?
1. Erabiltzaileak galdera bat egiten du. 2. Sistemak dokumentu-zati garrantzitsuak bilatzen ditu bektore datu-base batean (embedding + antzekotasun-bilaketa). 3. Aurkitutako zatiak prompt-ari testuinguru gisa gehitzen zaizkio. 4. Ereduak erantzuna sortzen du iturriak aipatuz.
RAG vs fine-tuning
Erabili RAG datuak aldatzen direnean (ezagutza-basea, dokumentazioa, araudiak). Erabili fine-tuning ereduaren portaera aldatu nahi duzunean (erantzun-estiloa, formatua, domeinu-espezializazioa). Enpresa-praktikan, bi ikuspegiak konbinatzen dira normalean.