Modelo fundacional

¿Qué es un modelo fundacional?

Un modelo fundacional es un modelo de IA grande preentrenado en conjuntos de datos masivos (texto, imágenes, código, audio) sin especialización. Ejemplos: GPT-4, Claude, Gemini, Llama. El modelo fundacional es una «base» que luego se adapta para aplicaciones específicas.

De la base a la especialización

Un modelo fundacional sin ajustar es un generalista. La personalización se realiza mediante: fine-tuning (reentrenamiento con datos de dominio), RAG (proporcionar contexto desde bases de conocimiento), prompt engineering (instrucciones de sistema que definen rol y restricciones) y RLHF (aprendizaje por retroalimentación humana).

Modelos abiertos vs cerrados

Los modelos fundacionales vienen en versión abierta (Llama, Mistral — descargables, ejecutables en tus servidores) y cerrada (GPT-4, Claude — accesibles solo vía API). La elección afecta al coste, la privacidad, la flexibilidad de personalización y el riesgo de vendor lock-in.

¿Qué es un modelo fundacional?

De la base a la especialización

Modelos abiertos vs cerrados

Términos relacionados

Servicios y productos relacionados