Grįžti į žodyną Saugumas

DI duomenų anonimizavimas

Automatinis asmens duomenų (PII) pašalinimas arba maskavimas mokymo rinkiniuose ir DI modelio užklausose, atitinkantis BDAR.

Kas yra DI duomenų anonimizavimas?

DI duomenų anonimizavimas — tai automatinio asmenį identifikuojančios informacijos (PII) aptikimo ir pašalinimo arba maskavimo procesas prieš DI modelių apdorojimą. Tai apima vardus, asmens kodus, el. pašto adresus, telefono numerius, IP adresus ir kitus identifikatorius.

Kodėl tai svarbu?

Neanonimizuotų duomenų siuntimas LLM (ypač debesyje esantiems) kelia rimtą riziką: BDAR pažeidimus, asmens duomenų nutekėjimą ir duomenų naudojimą išorinių modelių mokymui. Anonimizavimas leidžia pasinaudoti DI galia nekeliant grėsmės klientų ir darbuotojų privatumui.

Anonimizavimo technikos

Šiuolaikinės sistemos derina: pavadintų esybių atpažinimą (NER) PII nustatymui, grįžtamąjį tokenizavimą (PII pakeitimas žetonais, kurie gali atkurti originalus), pseudonimizavimą (pakeitimas fiktyviais, bet struktūriškai tinkamais duomenimis) ir k-anonimizavimą statistiniams duomenų rinkiniams.