Tagasi sõnastikku Turvalisus

Tehisintellekti andmete anonümiseerimine

Isikuandmete (PII) automaatne eemaldamine või maskeerimine treeningandmestikes ja tehisintellekti mudeli päringutes, GDPR-iga kooskõlas.

Mis on tehisintellekti andmete anonümiseerimine?

Tehisintellekti andmete anonümiseerimine on isikut tuvastava teabe (PII) automaatse tuvastamise ja eemaldamise või maskeerimise protsess enne tehisintellekti mudelitega töötlemist. See hõlmab nimesid, isikukoode, e-posti aadresse, telefoninumbreid, IP-aadresse ja muid identifikaatoreid.

Miks on see kriitiline?

Anonümiseerimata andmete saatmine LLM-idele (eriti pilves asuvatele) kannab tõsiseid riske: GDPR-i rikkumised, isikuandmete lekkimine ja andmete kasutamine väliste mudelite treenimiseks. Anonümiseerimine võimaldab kasutada tehisintellekti võimsust ilma klientide ja töötajate privaatsust ohustamata.

Anonümiseerimise tehnikad

Kaasaegsed süsteemid ühendavad: nimeüksuste tuvastamise (NER) PII tuvastamiseks, pööratava tokeniseerimise (PII asendamine tokenitega, mis suudavad originaalid taastada), pseudonümiseerimise (asendamine väljamõeldud, aga struktuuriliselt kehtivate andmetega) ja k-anonümiseerimise statistiliste andmekogumite jaoks.