Zpět na slovník Technologie

RAG (Retrieval-Augmented Generation)

Technika kombinující vyhledávání informací s generováním — AI odpovídá na základě aktuálních dokumentů, nejen své „paměti".

Co je RAG?

Retrieval-Augmented Generation (RAG) kombinuje dvě fáze: retrieval (vyhledání relevantních dokumentů ze znalostní báze) a generation (generování odpovědí na základě nalezených materiálů). Model se nespoléhá na trénovací paměť, ale na poskytnutá aktuální data.

Jak funguje RAG pipeline?

1. Uživatel položí otázku. 2. Systém vyhledá relevantní fragmenty dokumentů ve vektorové databázi (embedding + vyhledávání podobnosti). 3. Nalezené fragmenty jsou přidány do promptu jako kontext. 4. Model vygeneruje odpověď s citacemi zdrojů.

RAG vs fine-tuning

Použijte RAG, když se data mění (znalostní báze, dokumentace, předpisy). Použijte fine-tuning, když chcete změnit chování modelu (styl odpovědí, formát, doménová specializace). V podnikové praxi se obvykle kombinují oba přístupy.

Související služby a produkty