Späť na slovník Bezpečnosť

Watermarking AI obsahu

AI watermarking je technika vkladania neviditelnych znaciek do AI-generovaneho obsahu (textu, obrazkov, videa) na umoznenie detekcie a autentifikacie zdroja obsahu.

Co je AI watermarking?

AI watermarking je metoda vlozenia skrytej identifikacnej znacky do AI-generovaneho obsahu bez vizualnej alebo sluchovej degradacie. Ciel je umoznit naslednu detekciu: "Bol tento obsah vygenerovany AI?" alebo dokonca "Ktory model ho vygeneroval?"

S narastajucim objemom AI obsahu na internete sa watermarking stava dolezitym nastrojom pre ochranu autorskych prav, detekovanie dezinformacii a regulacny compliance.

Technicke pristupy

Pre LLM text watermarking: Kirkirk et al. (2023) navrhli metodu, kde sa tokeny delia do "zelene" a "cervene" skupiny na zaklade pseudonahodneho klucu. Model uprednostnuje zelene tokeny behem generovania. Detektor moze statisticky overit, ci text bol generovany s tymto biasom.

Pre obrazkove watermarky sa pouzivaju frekvencie modifikacie v Fourier priestore, ktore su neviditelne okom, ale statisticky detekovatelne. Stable Signature od Meta integrueva watermark priamo do procesu generovania.

Obmedzenia a vyzvy

Watermarky su nie definitívnym riesenim. Mozne utoky zahrnaju preformulovanie textu (paraphrasing attacks), pridanie suma k obrazku (adversarial perturbations) alebo stlačenie/konvertovanie formatu. EU AI Act vyzaduje oznacovanie AI-generovaneho obsahu, co zvysuje tlak na robustne watermarking technologie.