Mi a hallucináció és miért jelenik meg
A hallucináció egy LLM-ben olyan információ generálása, amely hihetően hangzik, de tényszerűen hamis vagy indokolatlan. Ez nem „hiba” a rendszerhiba értelmében — ez a nyelvi modellek működésének következménye. Az LLM nem „tud” úgy, mint egy adatbázis — a legvalószínűbb következő tokent jósolja meg a tanítási statisztika alapján. Amikor a promptban olyan kérdés jelenik meg, amelyre a modellnek nincs jó lefedettsége a tanítási adatokban, a „legvalószínűbben hangzó” választ generálja. Ez a válasz gyakran helyes. Néha — nem.
A hallucinációk tipikus forgatókönyvei üzleti felhasználásokban:
- Nem létező bírósági határozatok vagy törvénycikkek idézése jogi tanácsadásban
- Funkció-, osztály- vagy könyvtárnevek kitalálása kódgenerálásnál
- Helytelen statisztikák vagy dátumok megadása jelentésekben
- Kapcsolatok, címek, telefonszámok kitalálása
- Hasonló nevű különböző cégekre vagy személyekre vonatkozó tények keverése
1. réteg — Grounding (RAG)
A hallucinációk csökkentésének leghatékonyabb egyetlen technikája a grounding — konkrét dokumentumok vagy adatok biztosítása a modellnek kontextusként, amelyekből a válaszokat merítenie kell. Klasszikus RAG (Retrieval-Augmented Generation):
- Felhasználói kérdés → a legrelevánsabb dokumentumrészletek keresése (vector search pgvector / Qdrant / Milvus adatbázisban)
- Részletek + kérdés → prompt „válaszolj kizárólag az alábbi dokumentumok alapján” utasítással
- Modell válasza → ellenőrzés, hogy tartalmaz-e idézeteket/referenciákat a forrásokra
A RAG tipikusan 60-80%-kal csökkenti a hallucinációkat „válaszolj a tudásbázisunkról szóló kérdésekre” típusú felhasználásokban. Nem szünteti meg őket teljesen — a modell még mindig „értelmezheti” a dokumentumokat indokolatlan módon. Ezért szükségesek további rétegek.
2. réteg — Self-consistency és ensemble
A self-consistency olyan technika, amely ugyanazt a kérdést többször (vagy több különböző modellnek) teszi fel, és összehasonlítja a válaszokat. Ha a válaszok konzisztensek — magas bizalom. Ha különböznek — jelzés, hogy a téma bizonytalan.
Gyakorlati változat: kérdezze meg a Claude Sonnetet, Llama 70B-t és Bieliket ugyanarról. Ha mindhárom ugyanazt a számot, dátumot, tényt adja vissza — valószínűleg helyes. Ha különböznek — eszkaláció emberhez vagy drágább modellhez (Opus). Ez a minta, amely a 8 szintű LLM routingban van implementálva, egyesíti a költségcsökkentést a megbízhatóság javításával.
3. réteg — Evaluation pipelines
Egy LLM produkciós bevezetése evaluation pipeline nélkül olyan, mint kódot írni tesztek nélkül. Konkrét metrikák:
- Faithfulness — a válasz a megadott dokumentumokból következik-e. Egy második AI modellel (LLM-as-judge) vagy RAGAS, deepeval típusú könyvtárral mérve.
- Answer relevance — a válasz a felhasználó kérdését érinti-e.
- Context precision — a legjobb részleteket adta-e vissza a retrieval (vector search minősége).
- Groundedness score — a válasz állításainak hány százalékához lehet forrást mutatni a kontextusban.
Minden új LLM-alapú alkalmazás buildjének át kellene mennie 50-500 evaluation kérdés halmazán ismert ground truth-szal. Ha a faithfulness 90% alá esik — deployment blokkolva.
4. réteg — Guardrails és output validáció
A guardrails olyan szabályok, amelyek validálják az LLM outputját, mielőtt a felhasználóhoz eljutna. Példák:
- Sémavalidáció — az outputnak meg kell felelnie egy konkrét sémának (JSON Schema, Pydantic). A „kitalált mezők” típusú hallucinációk mechanikusan észlelhetők.
- Forbidden patterns — nem megengedett minták (maszkolatlan PII, kontextuson kívüli pénzügyi adatok, potenciálisan káros tartalmak) észlelése és blokkolása.
- Citation enforcement — minden tényállításnak kell forrásidézettel rendelkeznie. Ha a modell nem idéz — a választ elutasítják.
- Numerikus tartomány validáció — az output számait értelem szempontjából ellenőrzik (pl. ár > 0, dátum ≤ ma, százalék 0-100 tartományban).
- Cross-reference check — az output összehasonlítása ténybázissal (pl. KRS, törvényidézetek szótára).
Könyvtárak: Guardrails AI, NeMo Guardrails, instructor (schema enforcementhez). A saját implementáció gyakran egyszerűbb és olcsóbb fenntartani.
5. réteg — Human-in-the-loop
Magas kockázatú alkalmazásokhoz (jogi, orvosi, pénzügyi, HR döntések) a human-in-the-loop réteg nélkülözhetetlen. Az AI modellek nem hoznak végleges döntést — támogatják az embert. Konkrét minták:
- Draft + review — az AI generálja a dokumentum/válasz első változatát, az ember ellenőrzi és elfogadja a küldés előtt.
- Confidence threshold — az alacsony confidence-szel rendelkező válaszok (self-consistency-ből vagy explicit confidence asking-ból) automatikusan emberhez eszkalálódnak.
- Random sampling QA — minden LLM válasz 5-10%-át manuálisan auditálják, a confidence-től függetlenül — alap minőségi metrika időben.
- Feedback loop — a felhasználó hibásnak jelölheti a választ; a rendszer tanul és javítja a retrievalt, prompteket, paramétereket.
Mérés — honnan tudjuk, hogy a csökkentés működik
Konkrét produkciós metrikák, amelyeket érdemes monitorozni:
- Hallucination rate — a manuális evaluáció (sampling) során hallucinációnak minősített válaszok aránya. Cél: business-critical alkalmazásokhoz 2% alatt.
- User feedback rate — a választ hibásnak jelölő felhasználók aránya.
- Escalation rate — az emberhez eszkalált lekérdezések aránya. Túl alacsony (5% alatt) — a rendszer valószínűleg kihagyja a bizonytalan eseteket. Túl magas (30% felett) — a rendszer nem nyújt automatizációs értéket.
- Faithfulness score regressziós tesztekben — havi trend.
- Time-to-correction — a hallucináció észlelésétől a javítás bevezetéséig (jobb retrieval, új guardrail, fine-tuning).
Következtetések a döntéshozóknak
A hallucinációk kezelhetők — beruházást igényelnek a többrétegű védelmi architektúrába. Az LLM-eket ezen architektúra nélkül bevezető cégek előbb-utóbb komoly incidensbe ütköznek (hibás információ közzététele ügyfélnek, hallucinált adatokon alapuló hibás döntés, reputációs kár). A teljes védelmi stack (RAG + evaluation + guardrails + human-in-the-loop) kiépítésének költsége tipikusan az LLM bevezetésének 15-30%-a — és ez abszolút szükséges beruházás a produkciós felhasználáshoz. A kihagyás következményei aszimmetrikusak: alacsony elmulasztási költség az esetek 95%-ában, katasztrofális 5%-ban.