Model Fundacional

Què és un Model Fundacional?

Un model fundacional és un gran model d'IA preentrenat amb conjunts massius de dades (text, imatges, codi, àudio) sense especialització. Exemples: GPT-4, Claude, Gemini, Llama. El model fundacional és una «base» que després s'adapta per a aplicacions específiques.

De la base a l'especialització

Un model fundacional nu és un generalista. La personalització es fa mitjançant: fine-tuning (reentrenament amb dades del domini), RAG (proporcionament de context des de bases de coneixement), prompt engineering (instruccions de sistema que defineixen rol i restriccions) i RLHF (aprenentatge a partir de retroalimentació humana).

Models oberts vs tancats

Els models fundacionals venen en oberts (Llama, Mistral — descarregables, executables als vostres servidors) i tancats (GPT-4, Claude — accessibles només via API). L'elecció afecta el cost, la privacitat, la flexibilitat de personalització i el risc de dependència del proveïdor.

Què és un Model Fundacional?

De la base a l'especialització

Models oberts vs tancats

Termes relacionats

Serveis i productes relacionats