LLM hallucinációk — hogyan észleljük, csökkentsük és kezeljük a kockázatot produkcióban

Mi a hallucináció és miért jelenik meg

A hallucináció egy LLM-ben olyan információ generálása, amely hihetően hangzik, de tényszerűen hamis vagy indokolatlan. Ez nem „hiba” a rendszerhiba értelmében — ez a nyelvi modellek működésének következménye. Az LLM nem „tud” úgy, mint egy adatbázis — a legvalószínűbb következő tokent jósolja meg a tanítási statisztika alapján. Amikor a promptban olyan kérdés jelenik meg, amelyre a modellnek nincs jó lefedettsége a tanítási adatokban, a „legvalószínűbben hangzó” választ generálja. Ez a válasz gyakran helyes. Néha — nem.

A hallucinációk tipikus forgatókönyvei üzleti felhasználásokban:

Nem létező bírósági határozatok vagy törvénycikkek idézése jogi tanácsadásban
Funkció-, osztály- vagy könyvtárnevek kitalálása kódgenerálásnál
Helytelen statisztikák vagy dátumok megadása jelentésekben
Kapcsolatok, címek, telefonszámok kitalálása
Hasonló nevű különböző cégekre vagy személyekre vonatkozó tények keverése

1. réteg — Grounding (RAG)

A hallucinációk csökkentésének leghatékonyabb egyetlen technikája a grounding — konkrét dokumentumok vagy adatok biztosítása a modellnek kontextusként, amelyekből a válaszokat merítenie kell. Klasszikus RAG (Retrieval-Augmented Generation):

Felhasználói kérdés → a legrelevánsabb dokumentumrészletek keresése (vector search pgvector / Qdrant / Milvus adatbázisban)
Részletek + kérdés → prompt „válaszolj kizárólag az alábbi dokumentumok alapján” utasítással
Modell válasza → ellenőrzés, hogy tartalmaz-e idézeteket/referenciákat a forrásokra

A RAG tipikusan 60-80%-kal csökkenti a hallucinációkat „válaszolj a tudásbázisunkról szóló kérdésekre” típusú felhasználásokban. Nem szünteti meg őket teljesen — a modell még mindig „értelmezheti” a dokumentumokat indokolatlan módon. Ezért szükségesek további rétegek.

2. réteg — Self-consistency és ensemble

A self-consistency olyan technika, amely ugyanazt a kérdést többször (vagy több különböző modellnek) teszi fel, és összehasonlítja a válaszokat. Ha a válaszok konzisztensek — magas bizalom. Ha különböznek — jelzés, hogy a téma bizonytalan.

Gyakorlati változat: kérdezze meg a Claude Sonnetet, Llama 70B-t és Bieliket ugyanarról. Ha mindhárom ugyanazt a számot, dátumot, tényt adja vissza — valószínűleg helyes. Ha különböznek — eszkaláció emberhez vagy drágább modellhez (Opus). Ez a minta, amely a 8 szintű LLM routingban van implementálva, egyesíti a költségcsökkentést a megbízhatóság javításával.

3. réteg — Evaluation pipelines

Egy LLM produkciós bevezetése evaluation pipeline nélkül olyan, mint kódot írni tesztek nélkül. Konkrét metrikák:

Faithfulness — a válasz a megadott dokumentumokból következik-e. Egy második AI modellel (LLM-as-judge) vagy RAGAS, deepeval típusú könyvtárral mérve.
Answer relevance — a válasz a felhasználó kérdését érinti-e.
Context precision — a legjobb részleteket adta-e vissza a retrieval (vector search minősége).
Groundedness score — a válasz állításainak hány százalékához lehet forrást mutatni a kontextusban.

Minden új LLM-alapú alkalmazás buildjének át kellene mennie 50-500 evaluation kérdés halmazán ismert ground truth-szal. Ha a faithfulness 90% alá esik — deployment blokkolva.

4. réteg — Guardrails és output validáció

A guardrails olyan szabályok, amelyek validálják az LLM outputját, mielőtt a felhasználóhoz eljutna. Példák:

Sémavalidáció — az outputnak meg kell felelnie egy konkrét sémának (JSON Schema, Pydantic). A „kitalált mezők” típusú hallucinációk mechanikusan észlelhetők.
Forbidden patterns — nem megengedett minták (maszkolatlan PII, kontextuson kívüli pénzügyi adatok, potenciálisan káros tartalmak) észlelése és blokkolása.
Citation enforcement — minden tényállításnak kell forrásidézettel rendelkeznie. Ha a modell nem idéz — a választ elutasítják.
Numerikus tartomány validáció — az output számait értelem szempontjából ellenőrzik (pl. ár > 0, dátum ≤ ma, százalék 0-100 tartományban).
Cross-reference check — az output összehasonlítása ténybázissal (pl. KRS, törvényidézetek szótára).

Könyvtárak: Guardrails AI, NeMo Guardrails, instructor (schema enforcementhez). A saját implementáció gyakran egyszerűbb és olcsóbb fenntartani.

5. réteg — Human-in-the-loop

Magas kockázatú alkalmazásokhoz (jogi, orvosi, pénzügyi, HR döntések) a human-in-the-loop réteg nélkülözhetetlen. Az AI modellek nem hoznak végleges döntést — támogatják az embert. Konkrét minták:

Draft + review — az AI generálja a dokumentum/válasz első változatát, az ember ellenőrzi és elfogadja a küldés előtt.
Confidence threshold — az alacsony confidence-szel rendelkező válaszok (self-consistency-ből vagy explicit confidence asking-ból) automatikusan emberhez eszkalálódnak.
Random sampling QA — minden LLM válasz 5-10%-át manuálisan auditálják, a confidence-től függetlenül — alap minőségi metrika időben.
Feedback loop — a felhasználó hibásnak jelölheti a választ; a rendszer tanul és javítja a retrievalt, prompteket, paramétereket.

Mérés — honnan tudjuk, hogy a csökkentés működik

Konkrét produkciós metrikák, amelyeket érdemes monitorozni:

Hallucination rate — a manuális evaluáció (sampling) során hallucinációnak minősített válaszok aránya. Cél: business-critical alkalmazásokhoz 2% alatt.
User feedback rate — a választ hibásnak jelölő felhasználók aránya.
Escalation rate — az emberhez eszkalált lekérdezések aránya. Túl alacsony (5% alatt) — a rendszer valószínűleg kihagyja a bizonytalan eseteket. Túl magas (30% felett) — a rendszer nem nyújt automatizációs értéket.
Faithfulness score regressziós tesztekben — havi trend.
Time-to-correction — a hallucináció észlelésétől a javítás bevezetéséig (jobb retrieval, új guardrail, fine-tuning).

Következtetések a döntéshozóknak

A hallucinációk kezelhetők — beruházást igényelnek a többrétegű védelmi architektúrába. Az LLM-eket ezen architektúra nélkül bevezető cégek előbb-utóbb komoly incidensbe ütköznek (hibás információ közzététele ügyfélnek, hallucinált adatokon alapuló hibás döntés, reputációs kár). A teljes védelmi stack (RAG + evaluation + guardrails + human-in-the-loop) kiépítésének költsége tipikusan az LLM bevezetésének 15-30%-a — és ez abszolút szükséges beruházás a produkciós felhasználáshoz. A kihagyás következményei aszimmetrikusak: alacsony elmulasztási költség az esetek 95%-ában, katasztrofális 5%-ban.

LLM hallucinációk &mdash; hogyan észleljük, csökkentsük és kezeljük a kockázatot produkcióban