Nazaj na slovar Varnost

Zastrupljanje podatkov

Napad z vbrizgavanjem zlonamernih podatkov v učni niz modela UI z namenom manipulacije njegovega vedenja v produkciji.

Kaj je zastrupljanje podatkov?

Zastrupljanje podatkov je napad, ki cilja fazo usposabljanja modela UI — zlonamerni podatki se vnesejo v učni niz, da bi model naučili neželenih vedenj.

Vrste napadov z zastrupitvijo

Napadi z vhodnimi vrati: model se obnaša normalno razen ob specifičnem vzorcu sprožilca. Ciljana zastrupitev: degradira točnost modela za specifičen podrazred. Neciljna zastrupitev: na splošno degradira zmogljivost modela.

Obramba pred napadi z zastrupitvijo

Strategije obrambe: skrbno nadzorovano zbiranje podatkov in provenienca, zaznavanje statističnih anomalij v učnih nizih in redne revizije modelov.

Povezane storitve in izdelki