Temeljni model

Što je temeljni model?

Temeljni model je veliki AI model prethodno treniran na masivnim skupovima podataka (tekst, slike, kod, audio) bez specijalizacije. Primjeri: GPT-4, Claude, Gemini, Llama. Temeljni model je "baza" koja se potom prilagođava za specifične primjene.

Od temelja do specijalizacije

Goli temeljni model je generalist. Prilagodba se odvija putem: fine-tuninga (ponovo treniranje na domenskim podacima), RAG-a (pružanje konteksta iz baza znanja), prompt engineeringa (sistemske upute koje definiraju ulogu i ograničenja) i RLHF-a (učenje iz povratnih informacija ljudi).

Otvoreni vs zatvoreni modeli

Temeljni modeli dolaze u otvorenim (Llama, Mistral — mogu se preuzeti, pokretati na vlastitim serverima) i zatvorenim verzijama (GPT-4, Claude — dostupni samo putem API-ja). Izbor utječe na trošak, privatnost, fleksibilnost prilagodbe i rizik od vezanosti uz jednog dobavljača.

Što je temeljni model?

Od temelja do specijalizacije

Otvoreni vs zatvoreni modeli

Povezani pojmovi

Povezane usluge i proizvodi