Otravenie dat

Pochopenie otravenia dat

Otravenie dat je technika utoku, kde útocníci zámerné zavádzaju poškodené, nesprávne oznacené alebo škodlivé vzorky do trenovacej datovej sady AI systému. Pretože modely strojového ucenia sa priamo ucia vzory z dat, aj malé percento otravených vzoriek môze vyznamne zmenit správanie modelu. Tieto utoky su zvlást nebezpecné, pretože nastávaju pred trénovaním.

Bežné vzory útoku

Utoky prevrátením štítkov menia štítky trenovacích príkladov na sposobenie systematickej chybnej klasifikácie. Utoky cistymi štítkami vkladaju správne oznacené, ale adversariálne vytvorené príklady, ktore posúvaju rozhodovaxie hranice. Dostupnostné utoky degraduju celkový vykon modelu vkladaním šumu.

Podnikové zmiernovanie

Obrana proti otraveniu dat vyzaduje prísnu správu dat v celom životnom cykle AI. Sledovanie proveniencie dat zabezpecuje, ze každý trenovací vzor má overený zdroj. Techniky detekcie štatistickych odlahlých hodnôt a sanitácie datovej sady môzu identifikovat anomálne vzorky pred trénovaním.

Pochopenie otravenia dat

Bežné vzory útoku

Podnikové zmiernovanie

Súvisiace pojmy

Súvisiace služby a produkty