Mudeli mürgitus (Model Poisoning)

Mudeli mürgituse mõistmine

Mudeli mürgitus tähistab rünnakuid, mis sihivad ML mudeli treenimisprotsessi ennast, tagaukse süstimisest jõudluse halvendamiseni. Erinevalt andmemürgitusest, mis sihib treenimisandmeid, manipuleerib mudeli mürgitus otse mudeli parameetreid või treenimisalgoritmi.

Mürgitusvektori tüübid

Tagaukse rünnakud süstivad peidetud funktsionaalsust, mille käivitab spetsiaalne päästik. Gradiendipõhised rünnakud on võimalikud födereeritud õppe seadistustes, kus pahatahtlikud osalejad saavad saata manipuleeritud gradiendi uuendusi.

Kaitsevised lähenemised

Tervikluse kontrollid ja allkirjad tagavad, et mudeleid ei ole muudetud. Turvalised kokkuvõtte protokollid födereeritud õppes kaitsevad kokkuvõtte protsessi. Treenimisinfrastruktuuri juurdepääsukontroll takistab loata muudatusi.

Mudeli mürgituse mõistmine

Mürgitusvektori tüübid

Kaitsevised lähenemised

Seotud mõisted

Seotud teenused ja tooted