Grįžti į žodyną Dirbtinis intelektas

Bazinis modelis

Didelis, iš anksto apmokytas DI modelis, tarnaujantis kaip pagrindas — pritaikomas per fine-tuningą konkrečioms reikmėms.

Kas yra bazinis modelis?

Bazinis modelis — tai didelis DI modelis, iš anksto apmokytas didelėse duomenų rinkiniuose (tekstu, vaizdais, kodu, garsu) be specializacijos. Pavyzdžiai: GPT-4, Claude, Gemini, Llama. Bazinis modelis yra "pagrindas", kuris vėliau pritaikomas konkrečioms reikmėms.

Nuo pagrindo iki specializacijos

Grynasis bazinis modelis yra generalistas. Pritaikymas vyksta per: fine-tuningą (perkvalifikavimas srities duomenimis), RAG (konteksto pateikimas iš žinių bazių), prompt inžineriją (sisteminės instrukcijos, apibrėžiančios vaidmenį ir apribojimus) ir RLHF (mokymasis iš žmonių atsiliepimų).

Atvirieji ir uždarieji modeliai

Baziniai modeliai būna atviri (Llama, Mistral — parsisiunčiami, paleidžiami savo serveriuose) ir uždari (GPT-4, Claude — prieinami tik per API). Pasirinkimas įtakoja išlaidas, privatumą, pritaikymo lankstumą ir priklausomybės nuo vieno tiekėjo riziką.