Mis on alusmudel?
Alusmudel on suur tehisintellekti mudel, mis on eeltreenitud massiivsetel andmekogumitel (tekst, pildid, kood, heli) ilma spetsialiseerumiseta. Näited: GPT-4, Claude, Gemini, Llama. Alusmudel on "baas", mida seejärel kohandatakse konkreetsete rakenduste jaoks.
Alusest spetsialiseerumiseni
Paljas alusmudel on generalist. Kohandamine toimub: fine-tuningu kaudu (valdkonnaandmetel ümberõpetamine), RAG-i kaudu (konteksti pakkumine teadmusbaasidest), prompt engineering kaudu (süsteemijuhised, mis määravad rolli ja piirangud) ja RLHF kaudu (inimeste tagasisidest õppimine).
Avatud vs suletud mudelid
Alusmudelid on saadaval avatud (Llama, Mistral — allalaaditavad, käitatavad omaenda serverites) ja suletud versioonidena (GPT-4, Claude — kättesaadavad ainult API kaudu). Valik mõjutab kulusid, privaatsust, kohandamise paindlikkust ja ühe tarnija lukustuse riski.