A feature engineering megértése
A feature engineering (jellemzőmérnökség) az a folyamat, amelynek során a tartományspecifikus tudás felhasználásával nyers adatokból olyan jellemzőket (features) hoznak létre, amelyeket az ML-modellek jobban ki tudnak aknázni. A jellemzők jó megválasztása döntő szerepet játszhat a modellteljesítményben — jobb jellemzőkkel egyszerűbb modellek is felülmúlhatják a rosszabb jellemzőkkel dolgozó összetett modelleket.
Jellemzőmérnöki technikák
A numerikus átalakítások normalizálást, standardizálást és logaritmikus átalakításokat foglalnak magukban az aszimmetrikus eloszlások kezelésére. A kategorikus kódolás one-hot, target vagy embedding kódolást alkalmaz kategorikus változókhoz. A szöveges jellemzők esetén a bag-of-words, TF-IDF és embedding-alapú megközelítések jönnek szóba. Az idősorok esetén a visszatekintő jellemzők, gördülő átlagok és szezonális dekompozíció tekinthetők be.
Automaizált feature engineering
Az automtizált feature engineering (AutoFE) eszközök csökkenthetik a manuális erőfeszítéseket az adatátalakítások és jellemzőkombinációk szisztematikus feltárásával. Ezek az eszközök a manuális erőfeszítést nem helyettesítik — az alkalmazási terület megértése kritikus maradt —, hanem kiegészítik azt a jellemzőterek szisztematikusabb feltárásával.