Επιστροφή στο γλωσσάριο Ασφάλεια

Δηλητηρίαση Δεδομένων (Data Poisoning)

Οι επιθέσεις δηλητηρίασης δεδομένων καταστρέφουν σύνολα δεδομένων εκπαίδευσης ΤΝ για να χειραγωγήσουν τη συμπεριφορά μοντέλου, εισάγοντας μεροληψίες ή backdoors που παραμένουν μετά την εκπαίδευση.

Τι Είναι η Δηλητηρίαση Δεδομένων;

Η δηλητηρίαση δεδομένων είναι ένας τύπος επίθεσης αντιπάλου όπου κακόβουλοι φορείς εισάγουν προσεκτικά διαμορφωμένα δεδομένα σε ένα σύνολο δεδομένων εκπαίδευσης για να επηρεάσουν τη συμπεριφορά του μοντέλου που προκύπτει. Μπορεί να αρκούν μόνο μερικές εκατοντάδες δηλητηριασμένα παραδείγματα σε ένα σύνολο εκατομμυρίων.

Τύποι Επιθέσεων

Οι επιθέσεις backdoor εισάγουν λανθασμένα ετικετοποιημένα παραδείγματα με ένα μοτίβο σκανδάλου. Οι επιθέσεις υποβάθμισης απόδοσης εισάγουν θορυβώδη παραδείγματα που μειώνουν τη συνολική ακρίβεια.

Επιχειρηματικές Άμυνες

Προστατευτείτε από δηλητηρίαση δεδομένων μέσω αυστηρών διαδικασιών προέλευσης δεδομένων που παρακολουθούν την προέλευση κάθε παραδείγματος εκπαίδευσης. Εφαρμόστε ανίχνευση ανωμαλιών σε σύνολα δεδομένων εκπαίδευσης.

Σχετικές υπηρεσίες και προϊόντα