Späť na slovník Bezpečnosť

Anonymizácia dát pomocou AI

Automatické odstraňovanie alebo maskovanie osobných údajov (PII) v trénovacích sadách a dotazoch na AI modely, v súlade s GDPR.

Čo je anonymizácia dát pomocou AI?

Anonymizácia dát pomocou AI je proces automatickej detekcie a odstránenia alebo maskovania osobných identifikačných údajov (PII) pred spracovaním AI modelmi. Zahŕňa mená, rodné čísla, e-mailové adresy, telefónne čísla, IP adresy a ďalšie identifikátory.

Prečo je to kritické?

Odosielanie neanonymizovaných dát do LLM (najmä cloudových) nesie vážne riziká: porušenie GDPR, únik osobných údajov a využitie dát na trénovanie externých modelov. Anonymizácia umožňuje využívať silu AI bez ohrozenia súkromia zákazníkov a zamestnancov.

Techniky anonymizácie

Moderné systémy kombinujú: rozpoznávanie pomenovaných entít (NER) na detekciu PII, reverzibilnú tokenizáciu (nahradenie PII tokenmi, ktoré môžu obnoviť originály), pseudonymizáciu (nahradenie fiktívnymi, ale štrukturálne validnými dátami) a k-anonymizáciu pre štatistické dátové sady.