Volver ao glosario Seguridade

Anonimización de Datos de IA

Eliminación ou enmascaramento automático de datos persoais (PII) en conxuntos de adestramento e consultas de modelos de IA, conforme ao RXPD.

Que é a anonimización de datos de IA?

A anonimización de datos de IA é o proceso de detectar e eliminar ou enmascarar automaticamente información de identificación persoal (PII) antes do procesamento por modelos de IA. Isto inclúe nomes, números de seguridade social, enderezos de correo electrónico, números de teléfono, enderezos IP e outros identificadores.

Por que é crítico?

Enviar datos non anonimizados a LLMs (especialmente baseados na nube) implica riscos graves: violacións do RXPD, filtracións de datos persoais e uso de datos para adestrar modelos externos. A anonimización permite aproveitar o poder da IA sen comprometer a privacidade de clientes e empregados.

Técnicas de anonimización

Os sistemas modernos combinan: Recoñecemento de Entidades Nomeadas (NER) para a detección de PII, tokenización reversíbel (substitución de PII por tokens que poden restaurar os orixinais), pseudonimización (substitución por datos ficticios pero estruturalmente válidos) e k-anonimización para conxuntos de datos estatísticos.