O que é o Versionamento de Modelos?
O versionamento de modelos é a prática de rastrear e gerir sistematicamente as alterações nos modelos de machine learning, incluindo os artefatos do modelo, os conjuntos de dados de treino, os valores dos hiperparâmetros, os resultados de avaliação e os metadados de proveniência. Tal como o controlo de versão de código permite que as equipas de software rastreiem alterações, revertam para versões anteriores e entendam a evolução do código ao longo do tempo, o versionamento de modelos fornece as mesmas capacidades para artefatos de ML.
O que Versionar
O versionamento abrangente de modelos rastreia: artefatos do modelo (pesos, arquitetura), configuração de treino (hiperparâmetros, framework, hardware), referências a conjuntos de dados de treino e validação (idealmente versionados separadamente), resultados de avaliação e métricas de desempenho, código de treino (commit hash de repositório), ambiente de treino (versões de dependências, versão do SO), e metadados de negócio (caso de uso pretendido, proprietário, data de aprovação).
Implementação Prática
Use uma plataforma de rastreamento de experimentos (MLflow, Weights & Biases, SageMaker Experiments) para capturar automaticamente os metadados de treino durante as corridas. Integre o armazenamento de modelos versionados num registo de modelos central. Estabeleça convenções de nomeação de versão que comuniquem o tipo de atualização (major re-treino vs atualização menor vs hotfix). Para sistemas de produção, nunca substitua versões de modelo em produção — implante uma nova versão e transite o tráfego gradualmente enquanto mantém a versão anterior disponível para reversão rápida.