¿Qué es un modelo fundacional?
Un modelo fundacional es un modelo de IA grande preentrenado en conjuntos de datos masivos (texto, imágenes, código, audio) sin especialización. Ejemplos: GPT-4, Claude, Gemini, Llama. El modelo fundacional es una «base» que luego se adapta para aplicaciones específicas.
De la base a la especialización
Un modelo fundacional sin ajustar es un generalista. La personalización se realiza mediante: fine-tuning (reentrenamiento con datos de dominio), RAG (proporcionar contexto desde bases de conocimiento), prompt engineering (instrucciones de sistema que definen rol y restricciones) y RLHF (aprendizaje por retroalimentación humana).
Modelos abiertos vs cerrados
Los modelos fundacionales vienen en versión abierta (Llama, Mistral — descargables, ejecutables en tus servidores) y cerrada (GPT-4, Claude — accesibles solo vía API). La elección afecta al coste, la privacidad, la flexibilidad de personalización y el riesgo de vendor lock-in.