Was ist KI-Datenanonymisierung?
KI-Datenanonymisierung ist der Prozess der automatischen Erkennung und Entfernung oder Maskierung personenbezogener Daten (PII), bevor sie von KI-Modellen verarbeitet werden. Dazu gehören Namen, Sozialversicherungsnummern, E-Mail-Adressen, Telefonnummern, IP-Adressen und andere Identifikatoren.
Warum ist das kritisch?
Das Senden nicht anonymisierter Daten an LLMs (insbesondere cloudbasierte) birgt ernsthafte Risiken: DSGVO-Verstöße, Datenlecks und Verwendung der Daten für externes Modelltraining. Anonymisierung ermöglicht die Nutzung der KI-Leistung, ohne die Privatsphäre von Kunden und Mitarbeitern zu gefährden.
Anonymisierungstechniken
Moderne Systeme kombinieren: Named Entity Recognition (NER) zur PII-Erkennung, reversible Tokenisierung (Ersetzen von PII durch Token, die Originale wiederherstellen können), Pseudonymisierung (Ersetzen durch fiktive, aber strukturell gültige Daten) und k-Anonymisierung für statistische Datensätze.