Základný model (Foundation Model)

Čo je základný model?

Základný model (Foundation Model) je veľký AI model predtrénovaný na rozsiahlych dátových sadách (text, obrázky, kód, audio) bez špecializácie. Príklady: GPT-4, Claude, Gemini, Llama. Základný model je „báza", ktorá sa potom prispôsobuje pre konkrétne aplikácie.

Od základu ku špecializácii

Samotný základný model je generalista. Prispôsobenie prebieha prostredníctvom: fine-tuningu (pretrénovanie na doménových dátach), RAG (poskytnutie kontextu zo znalostných báz), prompt engineeringu (systémové inštrukcie definujúce rolu a obmedzenia) a RLHF (učenie z ľudskej spätnej väzby).

Otvorené vs uzavreté modely

Základné modely existujú v otvorenej (Llama, Mistral — na stiahnutie, spustiteľné na vlastných serveroch) a uzavretej (GPT-4, Claude — prístupné iba cez API) variante. Voľba ovplyvňuje náklady, súkromie, flexibilitu prispôsobenia a riziko závislosti od dodávateľa.

Čo je základný model?

Od základu ku špecializácii

Otvorené vs uzavreté modely

Súvisiace pojmy

Súvisiace služby a produkty