Vissza a szójegyzékhez MLOps & Életciklus

Adatdrift (Data Drift)

A betanítási adatok és az éles adatok statisztikai tulajdonságainak megváltozása, amely a modellteljesítmény romlásához vezet, ha nem monitorozzák.

Az adatdrift megértése

Az adatdrift az az jelenség, amelynek során az éles adatok statisztikai tulajdonságai eltolódnak a modell betanítása során felhasznált adatoktól. Ez a teljesítmény romlásához vezet, mivel a modell olyan adatokon fut, amelyek más eloszlásból erednek, mint amire megtanult. Az adatdrift különösen szembetűnő az éles modellekben, amelyeket rendszeresen nem képeznek újra.

Drifttípusok

A kovariáns drift (feature drift) a bemeneti változók eloszlásának megváltozása, míg a célváltozók eloszlása stabil marad. A fogalomdrift (concept drift) magát az összefüggést változtatja meg az inputok és a kimenetek között. A label drift a kimeneti változók eloszlásának megváltozása.

Detekció és megválasz

Implementáljon folyamatos adatdrift-monitorozást olyan statisztikai tesztekkel, mint a Population Stability Index (PSI) vagy a Kolmogorov-Smirnov-teszt. Hozzon létre riasztórendszereket, amelyek a drift toleranciaszintje fölé emelkedve értesítik az ML-csapatokat. Határozza meg az újratanítási küszöbértékeket, amelyek automatizált vagy manuális modellfrissítéseket indítanak.