O que é um modelo fundacional?
Um modelo fundacional é um grande modelo de IA pré-treinado em conjuntos de dados massivos (texto, imagens, código, áudio) sem especialização. Exemplos: GPT-4, Claude, Gemini, Llama. O modelo fundacional é uma «base» que é depois adaptada para aplicações específicas.
Da base à especialização
Um modelo fundacional bruto é um generalista. A personalização faz-se através de: fine-tuning (re-treino com dados de domínio), RAG (fornecimento de contexto a partir de bases de conhecimento), prompt engineering (instruções de sistema que definem papel e restrições) e RLHF (aprendizagem a partir de feedback humano).
Modelos abertos vs fechados
Os modelos fundacionais existem em versão aberta (Llama, Mistral — descarregáveis, executáveis nos seus servidores) e fechada (GPT-4, Claude — acessíveis apenas via API). A escolha afeta custo, privacidade, flexibilidade de personalização e risco de vendor lock-in.