Modelo fundacional

O que é um modelo fundacional?

Um modelo fundacional é um grande modelo de IA pré-treinado em conjuntos de dados massivos (texto, imagens, código, áudio) sem especialização. Exemplos: GPT-4, Claude, Gemini, Llama. O modelo fundacional é uma «base» que é depois adaptada para aplicações específicas.

Da base à especialização

Um modelo fundacional bruto é um generalista. A personalização faz-se através de: fine-tuning (re-treino com dados de domínio), RAG (fornecimento de contexto a partir de bases de conhecimento), prompt engineering (instruções de sistema que definem papel e restrições) e RLHF (aprendizagem a partir de feedback humano).

Modelos abertos vs fechados

Os modelos fundacionais existem em versão aberta (Llama, Mistral — descarregáveis, executáveis nos seus servidores) e fechada (GPT-4, Claude — acessíveis apenas via API). A escolha afeta custo, privacidade, flexibilidade de personalização e risco de vendor lock-in.

O que é um modelo fundacional?

Da base à especialização

Modelos abertos vs fechados

Termos relacionados

Serviços e produtos relacionados