Mudeli mürgituse mõistmine
Mudeli mürgitus tähistab rünnakuid, mis sihivad ML mudeli treenimisprotsessi ennast, tagaukse süstimisest jõudluse halvendamiseni. Erinevalt andmemürgitusest, mis sihib treenimisandmeid, manipuleerib mudeli mürgitus otse mudeli parameetreid või treenimisalgoritmi.
Mürgitusvektori tüübid
Tagaukse rünnakud süstivad peidetud funktsionaalsust, mille käivitab spetsiaalne päästik. Gradiendipõhised rünnakud on võimalikud födereeritud õppe seadistustes, kus pahatahtlikud osalejad saavad saata manipuleeritud gradiendi uuendusi.
Kaitsevised lähenemised
Tervikluse kontrollid ja allkirjad tagavad, et mudeleid ei ole muudetud. Turvalised kokkuvõtte protokollid födereeritud õppes kaitsevad kokkuvõtte protsessi. Treenimisinfrastruktuuri juurdepääsukontroll takistab loata muudatusi.