Co je AI watermarking?
AI watermarking je metoda vlozenia skrytej identifikacnej znacky do AI-generovaneho obsahu bez vizualnej alebo sluchovej degradacie. Ciel je umoznit naslednu detekciu: "Bol tento obsah vygenerovany AI?" alebo dokonca "Ktory model ho vygeneroval?"
S narastajucim objemom AI obsahu na internete sa watermarking stava dolezitym nastrojom pre ochranu autorskych prav, detekovanie dezinformacii a regulacny compliance.
Technicke pristupy
Pre LLM text watermarking: Kirkirk et al. (2023) navrhli metodu, kde sa tokeny delia do "zelene" a "cervene" skupiny na zaklade pseudonahodneho klucu. Model uprednostnuje zelene tokeny behem generovania. Detektor moze statisticky overit, ci text bol generovany s tymto biasom.
Pre obrazkove watermarky sa pouzivaju frekvencie modifikacie v Fourier priestore, ktore su neviditelne okom, ale statisticky detekovatelne. Stable Signature od Meta integrueva watermark priamo do procesu generovania.
Obmedzenia a vyzvy
Watermarky su nie definitívnym riesenim. Mozne utoky zahrnaju preformulovanie textu (paraphrasing attacks), pridanie suma k obrazku (adversarial perturbations) alebo stlačenie/konvertovanie formatu. EU AI Act vyzaduje oznacovanie AI-generovaneho obsahu, co zvysuje tlak na robustne watermarking technologie.