Volver al glosario Seguridad

Anonimización de datos IA

Eliminación o enmascaramiento automático de datos personales (PII) en conjuntos de entrenamiento y consultas a modelos de IA, conforme al RGPD.

¿Qué es la anonimización de datos IA?

La anonimización de datos IA es el proceso de detección y eliminación o enmascaramiento automático de información de identificación personal (PII) antes del procesamiento por modelos de IA. Incluye nombres, números de seguridad social, direcciones de email, números de teléfono, direcciones IP y otros identificadores.

¿Por qué es crítico?

Enviar datos no anonimizados a LLMs (especialmente en la nube) conlleva riesgos serios: violaciones del RGPD, filtraciones de datos personales y uso de datos para entrenar modelos externos. La anonimización permite aprovechar el poder de la IA sin comprometer la privacidad de clientes y empleados.

Técnicas de anonimización

Los sistemas modernos combinan: reconocimiento de entidades nombradas (NER) para la detección de PII, tokenización reversible (sustitución de PII por tokens que permiten restaurar los originales), seudonimización (sustitución por datos ficticios pero estructuralmente válidos) y k-anonimización para conjuntos de datos estadísticos.