Nazaj na slovar Varnost

Anonimizacija podatkov z UI

Samodejno odstranjevanje ali maskiranje osebnih podatkov (PII) v učnih množicah in poizvedbah modelov UI, skladno z GDPR.

Kaj je anonimizacija podatkov z UI?

Anonimizacija podatkov z UI je proces samodejnega odkrivanja in odstranjevanja ali maskiranja osebno prepoznavnih informacij (PII), preden jih obdelajo modeli UI. To vključuje imena, EMŠO, e-poštne naslove, telefonske številke, naslove IP in druge identifikatorje.

Zakaj je to kritično?

Pošiljanje neanonimiziranih podatkov LLM-om (zlasti v oblaku) prinaša resna tveganja: kršitve GDPR, uhajanje osebnih podatkov in uporabo podatkov za učenje zunanjih modelov. Anonimizacija omogoča izkoriščanje moči UI brez ogrožanja zasebnosti strank in zaposlenih.

Tehnike anonimizacije

Moderni sistemi kombinirajo: prepoznavanje poimenovanih entitet (NER) za odkrivanje PII, reverzibilno tokenizacijo (zamenjava PII z žetoni, ki lahko obnovijo izvirnike), psevdonimizacijo (zamenjava z izmišljenimi, a strukturno veljavnimi podatki) in k-anonimizacijo za statistične podatkovne množice.