Înapoi la glosar Securitate

Anonimizarea datelor cu AI

Eliminarea sau mascarea automată a datelor cu caracter personal (PII) din seturile de antrenament și interogările modelelor AI, în conformitate cu GDPR.

Ce este anonimizarea datelor cu AI?

Anonimizarea datelor cu AI este procesul de detectare și eliminare sau mascare automată a informațiilor de identificare personală (PII) înainte de procesarea de către modelele AI. Aceasta include nume, numere de identificare, adrese de e-mail, numere de telefon, adrese IP și alți identificatori.

De ce este critic?

Trimiterea datelor neanonimizate către LLM-uri (în special cele bazate pe cloud) implică riscuri serioase: încălcări ale GDPR, scurgeri de date personale și utilizarea datelor pentru antrenarea modelelor externe. Anonimizarea permite valorificarea puterii AI fără a compromite confidențialitatea clienților și angajaților.

Tehnici de anonimizare

Sistemele moderne combină: recunoașterea entităților numite (NER) pentru detectarea PII, tokenizare reversibilă (înlocuirea PII cu tokeni care pot restaura originalele), pseudonimizare (înlocuirea cu date fictive dar valid structural) și k-anonimizare pentru seturi de date statistice.