Zurück zum Glossar Sicherheit

KI-Datenanonymisierung

Automatisches Entfernen oder Maskieren personenbezogener Daten (PII) in Trainingsdaten und KI-Modellanfragen — DSGVO-konform.

Was ist KI-Datenanonymisierung?

KI-Datenanonymisierung ist der Prozess der automatischen Erkennung und Entfernung oder Maskierung personenbezogener Daten (PII), bevor sie von KI-Modellen verarbeitet werden. Dazu gehören Namen, Sozialversicherungsnummern, E-Mail-Adressen, Telefonnummern, IP-Adressen und andere Identifikatoren.

Warum ist das kritisch?

Das Senden nicht anonymisierter Daten an LLMs (insbesondere cloudbasierte) birgt ernsthafte Risiken: DSGVO-Verstöße, Datenlecks und Verwendung der Daten für externes Modelltraining. Anonymisierung ermöglicht die Nutzung der KI-Leistung, ohne die Privatsphäre von Kunden und Mitarbeitern zu gefährden.

Anonymisierungstechniken

Moderne Systeme kombinieren: Named Entity Recognition (NER) zur PII-Erkennung, reversible Tokenisierung (Ersetzen von PII durch Token, die Originale wiederherstellen können), Pseudonymisierung (Ersetzen durch fiktive, aber strukturell gültige Daten) und k-Anonymisierung für statistische Datensätze.

Verwandte Dienstleistungen und Produkte