Kas yra bazinis modelis?
Bazinis modelis — tai didelis DI modelis, iš anksto apmokytas didelėse duomenų rinkiniuose (tekstu, vaizdais, kodu, garsu) be specializacijos. Pavyzdžiai: GPT-4, Claude, Gemini, Llama. Bazinis modelis yra "pagrindas", kuris vėliau pritaikomas konkrečioms reikmėms.
Nuo pagrindo iki specializacijos
Grynasis bazinis modelis yra generalistas. Pritaikymas vyksta per: fine-tuningą (perkvalifikavimas srities duomenimis), RAG (konteksto pateikimas iš žinių bazių), prompt inžineriją (sisteminės instrukcijos, apibrėžiančios vaidmenį ir apribojimus) ir RLHF (mokymasis iš žmonių atsiliepimų).
Atvirieji ir uždarieji modeliai
Baziniai modeliai būna atviri (Llama, Mistral — parsisiunčiami, paleidžiami savo serveriuose) ir uždari (GPT-4, Claude — prieinami tik per API). Pasirinkimas įtakoja išlaidas, privatumą, pritaikymo lankstumą ir priklausomybės nuo vieno tiekėjo riziką.