Što je temeljni model?
Temeljni model je veliki AI model prethodno treniran na masivnim skupovima podataka (tekst, slike, kod, audio) bez specijalizacije. Primjeri: GPT-4, Claude, Gemini, Llama. Temeljni model je "baza" koja se potom prilagođava za specifične primjene.
Od temelja do specijalizacije
Goli temeljni model je generalist. Prilagodba se odvija putem: fine-tuninga (ponovo treniranje na domenskim podacima), RAG-a (pružanje konteksta iz baza znanja), prompt engineeringa (sistemske upute koje definiraju ulogu i ograničenja) i RLHF-a (učenje iz povratnih informacija ljudi).
Otvoreni vs zatvoreni modeli
Temeljni modeli dolaze u otvorenim (Llama, Mistral — mogu se preuzeti, pokretati na vlastitim serverima) i zatvorenim verzijama (GPT-4, Claude — dostupni samo putem API-ja). Izbor utječe na trošak, privatnost, fleksibilnost prilagodbe i rizik od vezanosti uz jednog dobavljača.