Mi az alapmodell?
Az alapmodell (Foundation Model) egy nagy AI-modell, amelyet hatalmas adatkészleteken (szöveg, kép, kód, hang) tanítottak be specializáció nélkül. Példák: GPT-4, Claude, Gemini, Llama. Az alapmodell egy „bázis", amelyet aztán konkrét alkalmazásokhoz igazítanak.
Az alaptól a specializációig
Az önálló alapmodell generalista. A testreszabás a következőkkel történik: fine-tuning (újratanítás szakterületi adatokon), RAG (kontextus biztosítása tudásbázisokból), prompt engineering (szerepet és korlátokat meghatározó rendszerutasítások) és RLHF (emberi visszajelzésből való tanulás).
Nyílt vs zárt modellek
Az alapmodellek lehetnek nyíltak (Llama, Mistral — letölthetők, saját szervereken futtathatók) és zártak (GPT-4, Claude — csak API-n keresztül elérhetők). A választás befolyásolja a költségeket, az adatvédelmet, a testreszabási rugalmasságot és a szállítófüggőség kockázatát.