Kaj je zastrupljanje podatkov?
Zastrupljanje podatkov je napad, ki cilja fazo usposabljanja modela UI — zlonamerni podatki se vnesejo v učni niz, da bi model naučili neželenih vedenj.
Vrste napadov z zastrupitvijo
Napadi z vhodnimi vrati: model se obnaša normalno razen ob specifičnem vzorcu sprožilca. Ciljana zastrupitev: degradira točnost modela za specifičen podrazred. Neciljna zastrupitev: na splošno degradira zmogljivost modela.
Obramba pred napadi z zastrupitvijo
Strategije obrambe: skrbno nadzorovano zbiranje podatkov in provenienca, zaznavanje statističnih anomalij v učnih nizih in redne revizije modelov.