Bazinis modelis

Kas yra bazinis modelis?

Bazinis modelis — tai didelis DI modelis, iš anksto apmokytas didelėse duomenų rinkiniuose (tekstu, vaizdais, kodu, garsu) be specializacijos. Pavyzdžiai: GPT-4, Claude, Gemini, Llama. Bazinis modelis yra "pagrindas", kuris vėliau pritaikomas konkrečioms reikmėms.

Nuo pagrindo iki specializacijos

Grynasis bazinis modelis yra generalistas. Pritaikymas vyksta per: fine-tuningą (perkvalifikavimas srities duomenimis), RAG (konteksto pateikimas iš žinių bazių), prompt inžineriją (sisteminės instrukcijos, apibrėžiančios vaidmenį ir apribojimus) ir RLHF (mokymasis iš žmonių atsiliepimų).

Atvirieji ir uždarieji modeliai

Baziniai modeliai būna atviri (Llama, Mistral — parsisiunčiami, paleidžiami savo serveriuose) ir uždari (GPT-4, Claude — prieinami tik per API). Pasirinkimas įtakoja išlaidas, privatumą, pritaikymo lankstumą ir priklausomybės nuo vieno tiekėjo riziką.

Kas yra bazinis modelis?

Nuo pagrindo iki specializacijos

Atvirieji ir uždarieji modeliai

Susiję terminai

Susijusios paslaugos ir produktai