Späť na slovník MLOps & Zivotny cyklus

Datový drift

Datový drift nastáva, ked sa štatistické vlastnosti produkčných dat odchyluju od trenovacích dat, sposobujuc degradáciu vykonu AI modelu v priebehu casu.

Pochopenie datového driftu

Datový drift oznacuje zmeny v štatistickom rozdelení dat, s ktorymi sa AI model stretáva v produkcii v porovnaní s datami, na ktorych bol trénovaný. Datový drift je jednou z najcastejsích prícin ticheho degradovania AI modelu v produkčných prostrediach, nastávajuci kvôli meniacemu sa správaniu zákazníkov, trhovym podmienkam, sezónnym vzorcom alebo zmenám upstream systémov.

Typy driftu

Kovariantný drift nastáva, ked sa distribúcia vstupných príznakov mení, zatial co vztah medzi príznakmi a cielmi zostáva stabilný. Konceptuálny drift zahrnuje zmeny v základnom vztahu medzi vstupmi a výstupmi. Drift predchádzajucej pravdepodobnosti nastáva, ked sa distribúcia cielových tried mení. Každý typ vyzaduje rôzne metódy detekcie a stratégie nápravy.

Podnikové riadenie driftu

Implementujte automatizovanú detekciu driftu pomocou štatistickych testov — Kolmogorov-Smirnovov pre numerické príznaky, chi-kvadrat pre kategorické príznaky. Stanovte prahové hodnoty výstrah kalibrované na vašu toleranciu obchodného dopadu. Vybudujte dashboardy sledujuce metriky driftu spolu s metrikami vykonu modelu.