Povratak na rječnik Sigurnost

AI anonimizacija podataka

Automatsko uklanjanje ili maskiranje osobnih podataka (PII) u skupovima za treniranje i upitima AI modela, u skladu s GDPR-om.

Što je AI anonimizacija podataka?

AI anonimizacija podataka je proces automatskog otkrivanja i uklanjanja ili maskiranja osobno prepoznatljivih informacija (PII) prije obrade AI modelima. To uključuje imena, OIB-ove, adrese e-pošte, telefonske brojeve, IP adrese i druge identifikatore.

Zašto je to kritično?

Slanje neanonimiziranih podataka LLM-ovima (posebno onima u oblaku) nosi ozbiljne rizike: kršenje GDPR-a, curenje osobnih podataka i korištenje podataka za treniranje vanjskih modela. Anonimizacija omogućuje iskorištavanje snage AI-ja bez ugrožavanja privatnosti klijenata i zaposlenika.

Tehnike anonimizacije

Moderni sustavi kombiniraju: prepoznavanje imenovanih entiteta (NER) za otkrivanje PII, reverzibilnu tokenizaciju (zamjena PII tokenima koji mogu vratiti izvornike), pseudonimizaciju (zamjena fiktivnim, ali strukturno valjanim podacima) i k-anonimizaciju za statističke skupove podataka.