Anonimizacija podataka u praksi — GDPR, AI i zaštita privatnosti

Zašto anonimizacija nije opcionalna za AI sustave

Svaki put kada pošaljete email, ugovor ili CRM zapis LLM modelu radi analize, automatski izlažete osobne podatke. Ime klijenta, adresa, OIB, kontakt podaci — sve to je osobni podatak prema GDPR-u. Slanje takvih podataka eksternim AI servisima bez odgovarajućih zaštitnih mjera je potencijalno kršenje GDPR-a s ozbiljnim sankcijama.

Anonimizacija nije samo regulatorna obveza — to je temelj povjerenja. Klijenti i poslovni partneri sve više pitaju kako tvrtka tretira njihove podatke. Organizacije koje mogu dokazati robusne procese zaštite podataka grade konkurentsku prednost u tenderima i pregovorima.

Razlika između anonimizacije i pseudonimizacije

GDPR pravi jasnu razliku:

Pseudonimizacija — zamjena identifikatora pseudonimima koji se mogu reversibilno vratiti ključem. Podatak ostaje osoban prema GDPR-u, ali je smanjen rizik. GDPR prepoznaje pseudonimizaciju kao odgovarajuću tehničku mjeru.
Anonimizacija — trajno i ireverzibilno uklanjanje svih identifikatora. Anonimizirani podaci izlaze iz opsega GDPR-a. Regulatori strogo procjenjuju stvarnu učinkovitost anonimizacije.

Za AI procesiranje, pseudonimizacija je često praktičnija — podaci se šalju modelu bez identifikatora, ali originalne vrijednosti mogu se obnoviti u finalnom outputu za autorizirane korisnike.

Automatska detekcija PII entiteta

Ručno označavanje osobnih podataka u dokumentima nije skalabilno. Automatski PII detekcijski sustavi koriste NLP modele trenirane za prepoznavanje osobnih entiteta u tekstu: vlastita imena, adrese, telefonski brojevi, emailovi, OIB/JMBG, brojevi kreditnih kartica, datum rođenja, medicinski podaci, financijski podaci.

Detekcija radi u realnom vremenu — svaki dokument ili poruka prolaze kroz PII filter prije nego što dospiju do LLM modela. Osjetljivi entiteti se zamjenjuju reverzibilnim tokenima (npr. [PERSON_1], [ADDRESS_1]), LLM procesira anonimizirani tekst, a originalne vrijednosti se vraćaju samo u finalnom outputu vidljivom autoriziranim korisnicima.

Anoxy — ESKOM.AI-jev PII servis

Anoxy je naš namjenski mikroservis za anonimizaciju PII podataka. Interceptira podatke prije nego što dostignu bilo koji LLM i automatski maskira osobne identifikatore. Podržava 15+ tipova entiteta, konfigurabilne razine osjetljivosti po agentu i kategoriji podataka, i potpuni audit log svakog anonimizacijskog događaja.

Svaka organizacija može konfigurirati vlastita pravila — koji podaci se anonimiziraju za koji tip agenta, koji korisnici mogu vidjeti deanimizirani output. Ovo jamči da svaki LLM poziv poštuje GDPR, neovisno o tome koji model ili servis se koristi.

Lifecycle podataka i automatsko brisanje

Anonimizacija je jedan element upravljanja podacima — drugi je automatizacija lifecyclea. Podaci trebaju biti obrisani ili anonimizirani nakon što istekne svrha obrade. Automatizirani sustavi prate retention politike i izvršavaju brisanje bez ručne intervencije, s potpunim audit logom za svaki brisani zapis — dokaz due diligence u slučaju regulatornog pregleda.