Обратно към речника Сигурност

Анонимизация на данни с AI

Автоматично премахване или маскиране на лични данни (PII) в набори за обучение и заявки към AI модели, в съответствие с GDPR.

Какво е анонимизация на данни с AI?

Анонимизацията на данни с AI е процес на автоматично откриване и премахване или маскиране на лична идентифицираща информация (PII) преди обработка от AI модели. Това включва имена, лични номера, имейл адреси, телефонни номера, IP адреси и други идентификатори.

Защо е критично важно?

Изпращането на неанонимизирани данни до LLM-и (особено облачни) крие сериозни рискове: нарушения на GDPR, изтичане на лични данни и използване на данните за обучение на външни модели. Анонимизацията позволява да се използва силата на AI без компрометиране на поверителността на клиентите и служителите.

Техники за анонимизация

Модерните системи комбинират: разпознаване на именувани обекти (NER) за откриване на PII, обратима токенизация (замяна на PII с токени, които могат да възстановят оригиналите), псевдонимизация (замяна с измислени, но структурно валидни данни) и k-анонимизация за статистически набори от данни.