Обратно към речника Сигурност

Отравяне на данни

Отравянето на данни е тип атака, при която нападателите инжектират злонамерени данни в обучаващите данни, изкривявайки поведението на модела или имплантирайки задна вратичка.

Видове отравяне

Атаките за отравяне включват: отравяне на достъпността (изкривяване на поведението за всички категории), атаки с задна вратичка (имплантиране на скрити тригери) и отравяне на дезинформация (повторна маркировка на примери).

Вектор на заплахата

Отравянето на данни е по-правдоподобно в сценарии, при които обучаващите данни се изтеглят от активни платформи - уеб скрейпинг или публична обратна връзка. Нападателите могат умишлено да добавят злонамерено съдържание към тези източници.

Защита

Защитата включва идентифициране и филтриране на аномалии в данните, анализ на произхода на обучаващите данни, робустно обучение и мониторинг на производителността за внезапни промени.

Свързани услуги и продукти