Grįžti į žodyną mlops

Modelių versijavįmas

Praktikos ir įrankiai, skirti sekti, valdyti ir reprodukuoti DI modelių versijias per jų gyvavimo ciklą.

Kodėl modelių versijavimas svarbus

Modelių versijavimas išplečia kodo versijavimo principus mašininio mokymosi modeliams, sekdamas ne tik kodo pakeitimus, bet ir modelių svorius, mokyymo duomenis, hiperparametrrus, apmokymo koonfiigūraciją ir vertinimo metrikas. Tai būtina atkuriamumui, audituojamumui ir sėkmingam produkciinių DI sistemų valdymui. Be versijavimo organizacijos negali patikimai atkurti, palyginti ar grįžti prie ankstesnių modelių versijų.

DI modelių versijavimas yra sudėtingesnis nei kodo versijavimas, nes modeliai priklauso nuo trikampio: kodas + duomenis + konfiguracija. Pakketimas bet kuriame iš šių komponentų sukuria naują modelo versiją.

Versijų komponentai

Išsamsu modelių versijavimas seka: modelio artefaktus (svorius, architektūrą, konfigūraciją), mokymo kodą ir konvejerio konfigūraciją, mokymo duomenų nuorodas ir versijias, hiperparametrus ir apmokymo nustatymus, vertinimo metrikas ir lyginamusias etalonus, sąsajaų priklausomybes (įterpimų modeliai, tokenizatoriai), diegimo konfiguraaaciją ir kilmės grandinę (kas, kaoda, kodėl sukkūrė šią versiją).

Įmoninės gairės

Naudokite semantinį versijavimą (major.minor.patch) modeliams, kur major reiškia sulauzancčius pakeitimus, minor – naujas galimybes, o patch – taįsymus. Automatizuokite versijavimą kaip MLOps konvejerio dalį – kiekvienas apmokymo vykdymas automatiškai sukuria naują versiją. Saugokite visą kontekstą, reikalingą bet kurios versijos atkurimui. Įdiekite versijų palyginimo įrankius, leidžiiančius greitai įvertinti skirtumus tarp versijų. Nustatykite išsaugojimo politkas – kiek versijų saugoti ir kada archyvuoti senesnes. Integruokite versiijavimą su modelių registru ir diegimo sistemomis sklandiai gyvavimo ciklo valdymui.