Čo je základný model?
Základný model (Foundation Model) je veľký AI model predtrénovaný na rozsiahlych dátových sadách (text, obrázky, kód, audio) bez špecializácie. Príklady: GPT-4, Claude, Gemini, Llama. Základný model je „báza", ktorá sa potom prispôsobuje pre konkrétne aplikácie.
Od základu ku špecializácii
Samotný základný model je generalista. Prispôsobenie prebieha prostredníctvom: fine-tuningu (pretrénovanie na doménových dátach), RAG (poskytnutie kontextu zo znalostných báz), prompt engineeringu (systémové inštrukcie definujúce rolu a obmedzenia) a RLHF (učenie z ľudskej spätnej väzby).
Otvorené vs uzavreté modely
Základné modely existujú v otvorenej (Llama, Mistral — na stiahnutie, spustiteľné na vlastných serveroch) a uzavretej (GPT-4, Claude — prístupné iba cez API) variante. Voľba ovplyvňuje náklady, súkromie, flexibilitu prispôsobenia a riziko závislosti od dodávateľa.