Volver al glosario MLOps & Ciclo de vida

Versionado de modelos

El versionado de modelos rastrea los cambios en los modelos de IA, sus datos de entrenamiento y configuraciones para garantizar la reproducibilidad y permitir un rollback fiable.

¿Qué es el versionado de modelos?

El versionado de modelos es la práctica de rastrear y gestionar sistemáticamente las diferentes iteraciones de los modelos de machine learning a lo largo de su ciclo de vida. A diferencia del software tradicional donde el control de versiones se centra en el código fuente, el versionado de modelos ML debe capturar un conjunto más amplio de artefactos: pesos entrenados, instantáneas de datos, definiciones de features, configuraciones de hiperparámetros, código de preprocesamiento y resultados de evaluación.

Dimensiones del versionado

Un versionado eficaz abarca múltiples dimensiones interconectadas. El versionado de código usa Git para scripts de entrenamiento y definiciones de pipelines. El versionado de datos rastrea datasets con herramientas que manejan archivos binarios grandes. El versionado de artefactos almacena pesos entrenados con metadatos en un registro de modelos. El versionado de experimentos registra el contexto completo de entrenamiento. Las relaciones entre estas dimensiones deben preservarse para que cualquier modelo en producción pueda rastrearse hasta sus entradas exactas.

Estrategia empresarial de versionado

Establezca convenciones de versionado que soporten tanto la agilidad de desarrollo como la gobernanza de producción. Use versionado semántico para modelos en producción. Implemente almacenamiento inmutable de artefactos. Mantenga grafos de linaje que conecten versiones de modelos con sus datos, código y experimentos. Automatice la captura de metadatos. Defina políticas de retención según requisitos regulatorios. Permita rollback con un solo comando como mecanismo de seguridad crítico.