Torna al glossario Sicurezza

Anonimizzazione dati IA

Rimozione o mascheramento automatico dei dati personali (PII) nei set di addestramento e nelle query ai modelli IA, conforme al GDPR.

Cos'è l'anonimizzazione dati IA?

L'anonimizzazione dati IA è il processo di rilevamento e rimozione o mascheramento automatico delle informazioni di identificazione personale (PII) prima dell'elaborazione da parte dei modelli IA. Include nomi, codici fiscali, indirizzi email, numeri di telefono, indirizzi IP e altri identificatori.

Perché è critico?

L'invio di dati non anonimizzati ai LLM (specialmente cloud) comporta rischi seri: violazioni del GDPR, fughe di dati personali e utilizzo dei dati per l'addestramento di modelli esterni. L'anonimizzazione permette di sfruttare la potenza dell'IA senza compromettere la privacy di clienti e dipendenti.

Tecniche di anonimizzazione

I sistemi moderni combinano: Named Entity Recognition (NER) per il rilevamento PII, tokenizzazione reversibile (sostituzione dei PII con token che possono ripristinare gli originali), pseudonimizzazione (sostituzione con dati fittizi ma strutturalmente validi) e k-anonimizzazione per dataset statistici.