Watermarking AI obsahu

Co je AI watermarking?

AI watermarking je metoda vlozenia skrytej identifikacnej znacky do AI-generovaneho obsahu bez vizualnej alebo sluchovej degradacie. Ciel je umoznit naslednu detekciu: "Bol tento obsah vygenerovany AI?" alebo dokonca "Ktory model ho vygeneroval?"

S narastajucim objemom AI obsahu na internete sa watermarking stava dolezitym nastrojom pre ochranu autorskych prav, detekovanie dezinformacii a regulacny compliance.

Technicke pristupy

Pre LLM text watermarking: Kirkirk et al. (2023) navrhli metodu, kde sa tokeny delia do "zelene" a "cervene" skupiny na zaklade pseudonahodneho klucu. Model uprednostnuje zelene tokeny behem generovania. Detektor moze statisticky overit, ci text bol generovany s tymto biasom.

Pre obrazkove watermarky sa pouzivaju frekvencie modifikacie v Fourier priestore, ktore su neviditelne okom, ale statisticky detekovatelne. Stable Signature od Meta integrueva watermark priamo do procesu generovania.

Obmedzenia a vyzvy

Watermarky su nie definitívnym riesenim. Mozne utoky zahrnaju preformulovanie textu (paraphrasing attacks), pridanie suma k obrazku (adversarial perturbations) alebo stlačenie/konvertovanie formatu. EU AI Act vyzaduje oznacovanie AI-generovaneho obsahu, co zvysuje tlak na robustne watermarking technologie.

Co je AI watermarking?

Technicke pristupy

Obmedzenia a vyzvy

Súvisiace pojmy