Takaisin sanastoon Tietoturva

Tekoälyn data-anonymisointi

Henkilötietojen (PII) automaattinen poistaminen tai peittäminen koulutusaineistoissa ja tekoälymallikyselyissä, GDPR-yhteensopivasti.

Mitä on tekoälyn data-anonymisointi?

Tekoälyn data-anonymisointi on prosessi, jossa tunnistetaan ja poistetaan tai peitetään automaattisesti henkilökohtaisesti tunnistettava tieto (PII) ennen tekoälymallien käsittelyä. Tähän kuuluvat nimet, henkilötunnukset, sähköpostiosoitteet, puhelinnumerot, IP-osoitteet ja muut tunnisteet.

Miksi tämä on kriittistä?

Anonymisoimattoman datan lähettäminen LLM-malleille (erityisesti pilvipohjaisille) aiheuttaa vakavia riskejä: GDPR-rikkomukset, henkilötietovuodot ja datan käyttö ulkoisten mallien kouluttamiseen. Anonymisointi mahdollistaa tekoälyn voiman hyödyntämisen vaarantamatta asiakas- ja työntekijäyksityisyyttä.

Anonymisointitekniikat

Modernit järjestelmät yhdistävät: Named Entity Recognition (NER) PII:n tunnistamiseen, käännettävä tokenisaatio (PII:n korvaaminen tokeneilla, jotka voivat palauttaa alkuperäiset), pseudonymisointi (korvaaminen kuvitteellisella mutta rakenteellisesti pätevällä datalla) ja k-anonymisointi tilastollisille aineistoille.