Tagasi sõnastikku Turvalisus

Mudeli mürgitus (Model Poisoning)

Tehisintellekti turbeähvardus, milles ründajad mõjutavad treenimisprotsessi pahatahtlike käitumiste istutamiseks või jõudluse halvandamiseks.

Mudeli mürgituse mõistmine

Mudeli mürgitus tähistab rünnakuid, mis sihivad ML mudeli treenimisprotsessi ennast, tagaukse süstimisest jõudluse halvendamiseni. Erinevalt andmemürgitusest, mis sihib treenimisandmeid, manipuleerib mudeli mürgitus otse mudeli parameetreid või treenimisalgoritmi.

Mürgitusvektori tüübid

Tagaukse rünnakud süstivad peidetud funktsionaalsust, mille käivitab spetsiaalne päästik. Gradiendipõhised rünnakud on võimalikud födereeritud õppe seadistustes, kus pahatahtlikud osalejad saavad saata manipuleeritud gradiendi uuendusi.

Kaitsevised lähenemised

Tervikluse kontrollid ja allkirjad tagavad, et mudeleid ei ole muudetud. Turvalised kokkuvõtte protokollid födereeritud õppes kaitsevad kokkuvõtte protsessi. Treenimisinfrastruktuuri juurdepääsukontroll takistab loata muudatusi.

Seotud teenused ja tooted