Wróć do słownika Bezpieczeństwo

Watermarking AI (znakowanie treści AI)

Techniki osadzania niewidocznych znaczników w treściach generowanych przez AI w celu identyfikacji ich pochodzenia.

Czym jest watermarking AI?

Watermarking AI to technika osadzania ukrytych, trudnych do usunięcia znaczników (znaków wodnych) w treściach generowanych przez modele sztucznej inteligencji. Dotyczy to tekstu, obrazów, audio i wideo. Celem jest umożliwienie identyfikacji, że dana treść została wygenerowana przez AI, a także wskazanie konkretnego modelu lub operatora. Znaczniki powinny być niewidoczne dla użytkownika, ale wykrywalne algorytmicznie.

Metody znakowania

Dla tekstu stosuje się statystyczne watermarki modyfikujące rozkład prawdopodobieństwa tokenów — np. faworyzując tokeny z określonego podzbioru (green list). Dla obrazów wykorzystuje się techniki steganograficzne osadzające informacje w częstotliwościach niedostrzegalnych dla oka. Zaawansowane podejścia obejmują znakowanie na poziomie wag modelu, metadane kryptograficzne (C2PA) oraz techniki odporne na transformacje (przycinanie, kompresja, parafrazowanie).

Regulacje i wymogi biznesowe

AI Act wymaga oznaczania treści generowanych przez AI, czyniąc watermarking obowiązkiem regulacyjnym w Unii Europejskiej. Organizacje wdrażające systemy generatywne muszą zapewnić transparentność wobec użytkowników i możliwość weryfikacji pochodzenia treści. Skuteczny watermarking chroni przed dezinformacją, wspiera prawa autorskie i buduje zaufanie do systemów AI w środowisku enterprise.