Voltar ao glossário Segurança

Anonimização de dados IA

Remoção ou mascaramento automático de dados pessoais (PII) em conjuntos de treino e consultas a modelos de IA, em conformidade com o RGPD.

O que é a anonimização de dados IA?

A anonimização de dados IA é o processo de deteção e remoção ou mascaramento automático de informações de identificação pessoal (PII) antes do processamento por modelos de IA. Inclui nomes, números de identificação fiscal, endereços de email, números de telefone, endereços IP e outros identificadores.

Porque é crítico?

O envio de dados não anonimizados para LLMs (especialmente na cloud) acarreta riscos sérios: violações do RGPD, fugas de dados pessoais e utilização dos dados para treinar modelos externos. A anonimização permite aproveitar o poder da IA sem comprometer a privacidade de clientes e colaboradores.

Técnicas de anonimização

Os sistemas modernos combinam: Named Entity Recognition (NER) para deteção de PII, tokenização reversível (substituição de PII por tokens que permitem restaurar os originais), pseudonimização (substituição por dados fictícios mas estruturalmente válidos) e k-anonimização para conjuntos de dados estatísticos.