Vissza a szójegyzékhez MLOps & Életciklus

Feature engineering

Az a folyamat, amelynek során nyers adatokból olyan jellemzőket hoznak létre, amelyek javítják az ML-modellek prediktív erőit és teljesítményét.

A feature engineering megértése

A feature engineering (jellemzőmérnökség) az a folyamat, amelynek során a tartományspecifikus tudás felhasználásával nyers adatokból olyan jellemzőket (features) hoznak létre, amelyeket az ML-modellek jobban ki tudnak aknázni. A jellemzők jó megválasztása döntő szerepet játszhat a modellteljesítményben — jobb jellemzőkkel egyszerűbb modellek is felülmúlhatják a rosszabb jellemzőkkel dolgozó összetett modelleket.

Jellemzőmérnöki technikák

A numerikus átalakítások normalizálást, standardizálást és logaritmikus átalakításokat foglalnak magukban az aszimmetrikus eloszlások kezelésére. A kategorikus kódolás one-hot, target vagy embedding kódolást alkalmaz kategorikus változókhoz. A szöveges jellemzők esetén a bag-of-words, TF-IDF és embedding-alapú megközelítések jönnek szóba. Az idősorok esetén a visszatekintő jellemzők, gördülő átlagok és szezonális dekompozíció tekinthetők be.

Automaizált feature engineering

Az automtizált feature engineering (AutoFE) eszközök csökkenthetik a manuális erőfeszítéseket az adatátalakítások és jellemzőkombinációk szisztematikus feltárásával. Ezek az eszközök a manuális erőfeszítést nem helyettesítik — az alkalmazási terület megértése kritikus maradt —, hanem kiegészítik azt a jellemzőterek szisztematikusabb feltárásával.