Înțelegerea ingineriei caracteristicilor
Ingineria caracteristicilor (feature engineering) este procesul de utilizare a cunoștințelor specifice domeniului pentru a crea caracteristici (features) din date brute pe care modelele ML le pot exploata mai bine. Alegerea bună a caracteristicilor poate juca un rol decisiv în performanța modelului — cu caracteristici mai bune, modelele mai simple pot depăși modelele complexe cu caracteristici mai slabe.
Tehnici de inginerie a caracteristicilor
Transformările numerice includ normalizarea, standardizarea și transformările logaritmice. Codificarea categorică aplică codificarea one-hot, target sau embedding. Pentru caracteristicile textuale, abordările bag-of-words, TF-IDF și bazate pe embedding sunt considerate. Pentru serii temporale sunt relevante caracteristicile retrospective și mediile mobile.
Ingineria automată a caracteristicilor
Instrumentele de inginerie automată a caracteristicilor (AutoFE) pot reduce efortul manual prin explorarea sistematică a transformărilor datelor. Aceste instrumente nu înlocuiesc efortul manual — înțelegerea domeniului rămâne critică — ci îl completează.