Tagasi sõnastikku MLOps & Elutsükkel

Andmete triiv (Data Drift)

Tootmisandmete statistiliste omaduste muutus võrreldes treenimisandmetega, mis viib mudeli jõudluse halvenemiseni, kui seda ei jälgita.

Andmete triivi mõistmine

Andmete triiv on nähtus, kus tootmisandmete statistilised omadused kalduvad kõrvale mudeli treenimiseks kasutatud andmetest. See toob kaasa jõudluse halvenemise, kuna mudel töötab teisest jaotusest pärinevatel andmetel. Triiv on eriti märgatav tootmismudelites, mida regulaarselt ei treenita uuesti.

Triivi tüübid

Kovarianse triiv (tunnuste triiv) on sisendmuutujate jaotuse muutus. Kontseptuaalne triiv muudab sisendite ja väljundite vahelist suhet. Siltide triiv hõlmab väljundmuutujate jaotuse muutust.

Tuvastamine ja reageerimine

Rakendage pidevat andmete triivi monitoorimist statistiliste testidega nagu Population Stability Index (PSI). Looge hoiatussüsteemid, mis teavitavad ML-meeskondi, kui triiv ületab tolerantsi tasemeid. Määrake ümberõppe läved, mis käivitavad automaatsed või käsitsi mudelite uuendused.