Zpět na slovník Bezpečnost

Anonymizace dat pomocí AI

Automatické odstraňování nebo maskování osobních údajů (PII) v trénovacích sadách a dotazech na AI modely, v souladu s GDPR.

Co je anonymizace dat pomocí AI?

Anonymizace dat pomocí AI je proces automatické detekce a odstranění nebo maskování osobních identifikačních údajů (PII) před zpracováním AI modely. Zahrnuje jména, rodná čísla, e-mailové adresy, telefonní čísla, IP adresy a další identifikátory.

Proč je to kritické?

Odesílání neanonymizovaných dat do LLM (zejména cloudových) nese vážná rizika: porušení GDPR, únik osobních údajů a využití dat pro trénování externích modelů. Anonymizace umožňuje využívat sílu AI bez ohrožení soukromí zákazníků a zaměstnanců.

Techniky anonymizace

Moderní systémy kombinují: rozpoznávání pojmenovaných entit (NER) pro detekci PII, reverzibilní tokenizaci (nahrazení PII tokeny, které mohou obnovit originály), pseudonymizaci (nahrazení fiktivními, ale strukturálně validními daty) a k-anonymizaci pro statistické datové sady.