Pamata modelis

Kas ir pamata modelis?

Pamata modelis ir liels MI modelis, kas iepriekš apmācīts uz masīvām datu kopām (teksts, attēli, kods, audio) bez specializācijas. Piemēri: GPT-4, Claude, Gemini, Llama. Pamata modelis ir "bāze", ko pēc tam pielāgo konkrētiem pielietojumiem.

No pamata līdz specializācijai

Tīrs pamata modelis ir ģenerālists. Pielāgošana notiek: ar fine-tuningu (pārmācīšana uz nozares datiem), RAG (konteksta nodrošināšana no zināšanu bāzēm), prompt engineering (sistēmas instrukcijas, kas nosaka lomu un ierobežojumus) un RLHF (mācīšanās no cilvēku atsauksmēm).

Atvērtie pret slēgtiem modeļiem

Pamata modeļi ir pieejami atvērtajā (Llama, Mistral — lejupielādējami, palaižami uz saviem serveriem) un slēgtajā versijā (GPT-4, Claude — pieejami tikai caur API). Izvēle ietekmē izmaksas, privātumu, pielāgošanas elastību un piesaistes risku vienam piegādātājam.

Kas ir pamata modelis?

No pamata līdz specializācijai

Atvērtie pret slēgtiem modeļiem

Saistītie termini

Saistītie pakalpojumi un produkti