Povratak na rječnik Umjetna inteligencija

AI generiranje slika

AI modeli koji generiraju realistične slike, ilustracije i dizajne iz tekstualnih opisa — od Midjourney do DALL-E i Stable Diffusion.

Revolucija u vizualnom stvaranju

Generativni AI za slike doživio je dramatičan napredak 2022-2026: difuzijski modeli (Stable Diffusion, Midjourney, DALL-E) i GAN-ovi dostigli su razinu kvalitete koja je zapanjila vizualne profesionalce. Slike koje bi tražile sate rada dizajnera sada nastaju u sekundama iz tekstualnog prompta.

Tehnologije i modeli

Difuzijski modeli: iterativno uklanjanje šuma — dominantna arhitektura za visoko-kvalitetne slike. GAN-ovi: prethodna generacija, još uvijek u upotrebi za specifične zadatke. Transformeri za slike: arhitektura koja se širi iz NLP domene. Ključni parametri: rezolucija, stil, negativni prompt, seed za reproducibilnost.

Poslovne primjene i razmatranja

Marketing: vizuali za kampanje, testiranje koncepta, personalizacija. Dizajn: brza izrada prototipa, varijacije ideja. Mediji: ilustracije, konceptna vizualizacija. Kritična razmatranja: autorska prava AI-generiranog sadržaja (neriješeno u EU), potencijal za deepfake i dezinformacije, licenciranje modela treniranih na zaštićenim djelima.