Tilbage til ordlisten Sikkerhed

AI-dataanonymisering

Automatisk fjernelse eller maskering af persondata (PII) i træningssæt og AI-modelforespørgsler, GDPR-kompatibelt.

Hvad er AI-dataanonymisering?

AI-dataanonymisering er processen med automatisk at opdage og fjerne eller maskere personligt identificerbar information (PII), før den behandles af AI-modeller. Dette inkluderer navne, CPR-numre, e-mailadresser, telefonnumre, IP-adresser og andre identifikatorer.

Hvorfor er dette kritisk?

At sende ikke-anonymiserede data til LLM'er (især cloud-baserede) medfører alvorlige risici: GDPR-overtrædelser, personoplysningslæk og data, der bruges til at træne eksterne modeller. Anonymisering muliggør at udnytte AI's kraft uden at kompromittere kunde- og medarbejderprivathed.

Anonymiseringsteknikker

Moderne systemer kombinerer: Named Entity Recognition (NER) til PII-detektion, reversibel tokenisering (erstatter PII med tokens, der kan genskabe originaler), pseudonymisering (erstatter med fiktive men strukturelt gyldige data) og k-anonymisering for statistiske datasæt.