Vissza a bloghoz MI és gépi tanulás

LLM hallucinációk — hogyan észleljük, csökkentsük és kezeljük a kockázatot produkcióban

Zespół ESKOM.AI 2026-06-10 Olvasási idő: 9 min

Mi a hallucináció és miért jelenik meg

A hallucináció egy LLM-ben olyan információ generálása, amely hihetően hangzik, de tényszerűen hamis vagy indokolatlan. Ez nem „hiba” a rendszerhiba értelmében — ez a nyelvi modellek működésének következménye. Az LLM nem „tud” úgy, mint egy adatbázis — a legvalószínűbb következő tokent jósolja meg a tanítási statisztika alapján. Amikor a promptban olyan kérdés jelenik meg, amelyre a modellnek nincs jó lefedettsége a tanítási adatokban, a „legvalószínűbben hangzó” választ generálja. Ez a válasz gyakran helyes. Néha — nem.

A hallucinációk tipikus forgatókönyvei üzleti felhasználásokban:

  • Nem létező bírósági határozatok vagy törvénycikkek idézése jogi tanácsadásban
  • Funkció-, osztály- vagy könyvtárnevek kitalálása kódgenerálásnál
  • Helytelen statisztikák vagy dátumok megadása jelentésekben
  • Kapcsolatok, címek, telefonszámok kitalálása
  • Hasonló nevű különböző cégekre vagy személyekre vonatkozó tények keverése

1. réteg — Grounding (RAG)

A hallucinációk csökkentésének leghatékonyabb egyetlen technikája a grounding — konkrét dokumentumok vagy adatok biztosítása a modellnek kontextusként, amelyekből a válaszokat merítenie kell. Klasszikus RAG (Retrieval-Augmented Generation):

  • Felhasználói kérdés → a legrelevánsabb dokumentumrészletek keresése (vector search pgvector / Qdrant / Milvus adatbázisban)
  • Részletek + kérdés → prompt „válaszolj kizárólag az alábbi dokumentumok alapján” utasítással
  • Modell válasza → ellenőrzés, hogy tartalmaz-e idézeteket/referenciákat a forrásokra

A RAG tipikusan 60-80%-kal csökkenti a hallucinációkat „válaszolj a tudásbázisunkról szóló kérdésekre” típusú felhasználásokban. Nem szünteti meg őket teljesen — a modell még mindig „értelmezheti” a dokumentumokat indokolatlan módon. Ezért szükségesek további rétegek.

2. réteg — Self-consistency és ensemble

A self-consistency olyan technika, amely ugyanazt a kérdést többször (vagy több különböző modellnek) teszi fel, és összehasonlítja a válaszokat. Ha a válaszok konzisztensek — magas bizalom. Ha különböznek — jelzés, hogy a téma bizonytalan.

Gyakorlati változat: kérdezze meg a Claude Sonnetet, Llama 70B-t és Bieliket ugyanarról. Ha mindhárom ugyanazt a számot, dátumot, tényt adja vissza — valószínűleg helyes. Ha különböznek — eszkaláció emberhez vagy drágább modellhez (Opus). Ez a minta, amely a 8 szintű LLM routingban van implementálva, egyesíti a költségcsökkentést a megbízhatóság javításával.

3. réteg — Evaluation pipelines

Egy LLM produkciós bevezetése evaluation pipeline nélkül olyan, mint kódot írni tesztek nélkül. Konkrét metrikák:

  • Faithfulness — a válasz a megadott dokumentumokból következik-e. Egy második AI modellel (LLM-as-judge) vagy RAGAS, deepeval típusú könyvtárral mérve.
  • Answer relevance — a válasz a felhasználó kérdését érinti-e.
  • Context precision — a legjobb részleteket adta-e vissza a retrieval (vector search minősége).
  • Groundedness score — a válasz állításainak hány százalékához lehet forrást mutatni a kontextusban.

Minden új LLM-alapú alkalmazás buildjének át kellene mennie 50-500 evaluation kérdés halmazán ismert ground truth-szal. Ha a faithfulness 90% alá esik — deployment blokkolva.

4. réteg — Guardrails és output validáció

A guardrails olyan szabályok, amelyek validálják az LLM outputját, mielőtt a felhasználóhoz eljutna. Példák:

  • Sémavalidáció — az outputnak meg kell felelnie egy konkrét sémának (JSON Schema, Pydantic). A „kitalált mezők” típusú hallucinációk mechanikusan észlelhetők.
  • Forbidden patterns — nem megengedett minták (maszkolatlan PII, kontextuson kívüli pénzügyi adatok, potenciálisan káros tartalmak) észlelése és blokkolása.
  • Citation enforcement — minden tényállításnak kell forrásidézettel rendelkeznie. Ha a modell nem idéz — a választ elutasítják.
  • Numerikus tartomány validáció — az output számait értelem szempontjából ellenőrzik (pl. ár > 0, dátum ≤ ma, százalék 0-100 tartományban).
  • Cross-reference check — az output összehasonlítása ténybázissal (pl. KRS, törvényidézetek szótára).

Könyvtárak: Guardrails AI, NeMo Guardrails, instructor (schema enforcementhez). A saját implementáció gyakran egyszerűbb és olcsóbb fenntartani.

5. réteg — Human-in-the-loop

Magas kockázatú alkalmazásokhoz (jogi, orvosi, pénzügyi, HR döntések) a human-in-the-loop réteg nélkülözhetetlen. Az AI modellek nem hoznak végleges döntést — támogatják az embert. Konkrét minták:

  • Draft + review — az AI generálja a dokumentum/válasz első változatát, az ember ellenőrzi és elfogadja a küldés előtt.
  • Confidence threshold — az alacsony confidence-szel rendelkező válaszok (self-consistency-ből vagy explicit confidence asking-ból) automatikusan emberhez eszkalálódnak.
  • Random sampling QA — minden LLM válasz 5-10%-át manuálisan auditálják, a confidence-től függetlenül — alap minőségi metrika időben.
  • Feedback loop — a felhasználó hibásnak jelölheti a választ; a rendszer tanul és javítja a retrievalt, prompteket, paramétereket.

Mérés — honnan tudjuk, hogy a csökkentés működik

Konkrét produkciós metrikák, amelyeket érdemes monitorozni:

  • Hallucination rate — a manuális evaluáció (sampling) során hallucinációnak minősített válaszok aránya. Cél: business-critical alkalmazásokhoz 2% alatt.
  • User feedback rate — a választ hibásnak jelölő felhasználók aránya.
  • Escalation rate — az emberhez eszkalált lekérdezések aránya. Túl alacsony (5% alatt) — a rendszer valószínűleg kihagyja a bizonytalan eseteket. Túl magas (30% felett) — a rendszer nem nyújt automatizációs értéket.
  • Faithfulness score regressziós tesztekben — havi trend.
  • Time-to-correction — a hallucináció észlelésétől a javítás bevezetéséig (jobb retrieval, új guardrail, fine-tuning).

Következtetések a döntéshozóknak

A hallucinációk kezelhetők — beruházást igényelnek a többrétegű védelmi architektúrába. Az LLM-eket ezen architektúra nélkül bevezető cégek előbb-utóbb komoly incidensbe ütköznek (hibás információ közzététele ügyfélnek, hallucinált adatokon alapuló hibás döntés, reputációs kár). A teljes védelmi stack (RAG + evaluation + guardrails + human-in-the-loop) kiépítésének költsége tipikusan az LLM bevezetésének 15-30%-a — és ez abszolút szükséges beruházás a produkciós felhasználáshoz. A kihagyás következményei aszimmetrikusak: alacsony elmulasztási költség az esetek 95%-ában, katasztrofális 5%-ban.

#halucynacje #LLM #RAG #guardrails #evaluation #human-in-the-loop