Tagasi sõnastikku Tehisintellekt

Alusmudel

Suur, eeltreenitud tehisintellekti mudel, mis on aluseks — kohandatakse fine-tuningu kaudu konkreetsete rakenduste jaoks.

Mis on alusmudel?

Alusmudel on suur tehisintellekti mudel, mis on eeltreenitud massiivsetel andmekogumitel (tekst, pildid, kood, heli) ilma spetsialiseerumiseta. Näited: GPT-4, Claude, Gemini, Llama. Alusmudel on "baas", mida seejärel kohandatakse konkreetsete rakenduste jaoks.

Alusest spetsialiseerumiseni

Paljas alusmudel on generalist. Kohandamine toimub: fine-tuningu kaudu (valdkonnaandmetel ümberõpetamine), RAG-i kaudu (konteksti pakkumine teadmusbaasidest), prompt engineering kaudu (süsteemijuhised, mis määravad rolli ja piirangud) ja RLHF kaudu (inimeste tagasisidest õppimine).

Avatud vs suletud mudelid

Alusmudelid on saadaval avatud (Llama, Mistral — allalaaditavad, käitatavad omaenda serverites) ja suletud versioonidena (GPT-4, Claude — kättesaadavad ainult API kaudu). Valik mõjutab kulusid, privaatsust, kohandamise paindlikkust ja ühe tarnija lukustuse riski.