Tornar al glossari Seguretat

Anonimització de Dades d'IA

Eliminació o emmascarament automàtic de dades personals (PII) en conjunts d'entrenament i consultes de models d'IA, conforme al RGPD.

Què és l'anonimització de dades d'IA?

L'anonimització de dades d'IA és el procés de detectar i eliminar o emmascarar automàticament informació d'identificació personal (PII) abans del processament per models d'IA. Això inclou noms, números de seguretat social, adreces de correu electrònic, números de telèfon, adreces IP i altres identificadors.

Per què és crític?

Enviar dades no anonimitzades a LLMs (especialment basats en el núvol) comporta riscos greus: violacions del RGPD, filtracions de dades personals i ús de dades per entrenar models externs. L'anonimització permet aprofitar el poder de la IA sense comprometre la privacitat de clients i empleats.

Tècniques d'anonimització

Els sistemes moderns combinen: Reconeixement d'Entitats Nomenades (NER) per a la detecció de PII, tokenització reversible (substitució de PII per tokens que poden restaurar els originals), pseudonimització (substitució per dades fictícies però estructuralment vàlides) i k-anonimització per a conjunts de dades estadístics.