Què és un Model Fundacional?
Un model fundacional és un gran model d'IA preentrenat amb conjunts massius de dades (text, imatges, codi, àudio) sense especialització. Exemples: GPT-4, Claude, Gemini, Llama. El model fundacional és una «base» que després s'adapta per a aplicacions específiques.
De la base a l'especialització
Un model fundacional nu és un generalista. La personalització es fa mitjançant: fine-tuning (reentrenament amb dades del domini), RAG (proporcionament de context des de bases de coneixement), prompt engineering (instruccions de sistema que defineixen rol i restriccions) i RLHF (aprenentatge a partir de retroalimentació humana).
Models oberts vs tancats
Els models fundacionals venen en oberts (Llama, Mistral — descarregables, executables als vostres servidors) i tancats (GPT-4, Claude — accessibles només via API). L'elecció afecta el cost, la privacitat, la flexibilitat de personalització i el risc de dependència del proveïdor.