Επιστροφή στο γλωσσάριο MLOps & Κύκλος ζωής

Απόκλιση Δεδομένων (Data Drift)

Η απόκλιση δεδομένων συμβαίνει όταν οι στατιστικές ιδιότητες δεδομένων παραγωγής αποκλίνουν από τα δεδομένα εκπαίδευσης, προκαλώντας υποβάθμιση απόδοσης μοντέλου ΤΝ με την πάροδο του χρόνου.

Τι Είναι η Απόκλιση Δεδομένων;

Η απόκλιση δεδομένων αναφέρεται σε αλλαγές στις στατιστικές ιδιότητες δεδομένων εισόδου με την πάροδο του χρόνου που κάνουν τα μοντέλα machine learning να υποβαθμίζονται σιωπηλά. Ένα μοντέλο εκπαιδευμένο σε συγκεκριμένη κατανομή δεδομένων γίνεται προοδευτικά λιγότερο ακριβές καθώς τα πραγματικά δεδομένα αποκλίνουν από αυτή. Η απόκλιση είναι ύπουλη γιατί μπορεί να συμβεί σταδιακά.

Τύποι Απόκλισης

Η απόκλιση συμμεταβλητών συμβαίνει όταν αλλάζει η κατανομή δεδομένων εισόδου αλλά η υποκείμενη σχέση παραμένει σταθερή. Η εννοιολογική απόκλιση είναι πιο σοβαρή — η ίδια η σχέση που μαθαίνει το μοντέλο έχει αλλάξει.

Ανίχνευση και Απόκριση

Εφαρμόστε στατιστικές δοκιμές απόκλισης σε pipelines παρακολούθησης. Θεσπίστε κατώφλια ειδοποίησης για χειροκίνητη έρευνα έναντι αυτόματης επανεκπαίδευσης. Σχεδιάστε για τακτική επανεκπαίδευση ακόμη και απουσία ανιχνευμένης απόκλισης.