Видове отравяне
Атаките за отравяне включват: отравяне на достъпността (изкривяване на поведението за всички категории), атаки с задна вратичка (имплантиране на скрити тригери) и отравяне на дезинформация (повторна маркировка на примери).
Вектор на заплахата
Отравянето на данни е по-правдоподобно в сценарии, при които обучаващите данни се изтеглят от активни платформи - уеб скрейпинг или публична обратна връзка. Нападателите могат умишлено да добавят злонамерено съдържание към тези източници.
Защита
Защитата включва идентифициране и филтриране на аномалии в данните, анализ на произхода на обучаващите данни, робустно обучение и мониторинг на производителността за внезапни промени.