Zašto anonimizacija nije opcionalna za AI sustave
Svaki put kada pošaljete email, ugovor ili CRM zapis LLM modelu radi analize, automatski izlažete osobne podatke. Ime klijenta, adresa, OIB, kontakt podaci — sve to je osobni podatak prema GDPR-u. Slanje takvih podataka eksternim AI servisima bez odgovarajućih zaštitnih mjera je potencijalno kršenje GDPR-a s ozbiljnim sankcijama.
Anonimizacija nije samo regulatorna obveza — to je temelj povjerenja. Klijenti i poslovni partneri sve više pitaju kako tvrtka tretira njihove podatke. Organizacije koje mogu dokazati robusne procese zaštite podataka grade konkurentsku prednost u tenderima i pregovorima.
Razlika između anonimizacije i pseudonimizacije
GDPR pravi jasnu razliku:
- Pseudonimizacija — zamjena identifikatora pseudonimima koji se mogu reversibilno vratiti ključem. Podatak ostaje osoban prema GDPR-u, ali je smanjen rizik. GDPR prepoznaje pseudonimizaciju kao odgovarajuću tehničku mjeru.
- Anonimizacija — trajno i ireverzibilno uklanjanje svih identifikatora. Anonimizirani podaci izlaze iz opsega GDPR-a. Regulatori strogo procjenjuju stvarnu učinkovitost anonimizacije.
Za AI procesiranje, pseudonimizacija je često praktičnija — podaci se šalju modelu bez identifikatora, ali originalne vrijednosti mogu se obnoviti u finalnom outputu za autorizirane korisnike.
Automatska detekcija PII entiteta
Ručno označavanje osobnih podataka u dokumentima nije skalabilno. Automatski PII detekcijski sustavi koriste NLP modele trenirane za prepoznavanje osobnih entiteta u tekstu: vlastita imena, adrese, telefonski brojevi, emailovi, OIB/JMBG, brojevi kreditnih kartica, datum rođenja, medicinski podaci, financijski podaci.
Detekcija radi u realnom vremenu — svaki dokument ili poruka prolaze kroz PII filter prije nego što dospiju do LLM modela. Osjetljivi entiteti se zamjenjuju reverzibilnim tokenima (npr. [PERSON_1], [ADDRESS_1]), LLM procesira anonimizirani tekst, a originalne vrijednosti se vraćaju samo u finalnom outputu vidljivom autoriziranim korisnicima.
Anoxy — ESKOM.AI-jev PII servis
Anoxy je naš namjenski mikroservis za anonimizaciju PII podataka. Interceptira podatke prije nego što dostignu bilo koji LLM i automatski maskira osobne identifikatore. Podržava 15+ tipova entiteta, konfigurabilne razine osjetljivosti po agentu i kategoriji podataka, i potpuni audit log svakog anonimizacijskog događaja.
Svaka organizacija može konfigurirati vlastita pravila — koji podaci se anonimiziraju za koji tip agenta, koji korisnici mogu vidjeti deanimizirani output. Ovo jamči da svaki LLM poziv poštuje GDPR, neovisno o tome koji model ili servis se koristi.
Lifecycle podataka i automatsko brisanje
Anonimizacija je jedan element upravljanja podacima — drugi je automatizacija lifecyclea. Podaci trebaju biti obrisani ili anonimizirani nakon što istekne svrha obrade. Automatizirani sustavi prate retention politike i izvršavaju brisanje bez ručne intervencije, s potpunim audit logom za svaki brisani zapis — dokaz due diligence u slučaju regulatornog pregleda.