Qu'est-ce que l'ingénierie des caractéristiques ?
L'ingénierie des caractéristiques est le processus de transformation et de création de variables d'entrée (caractéristiques) pour les modèles d'apprentissage automatique. Bien que les méthodes de deep learning puissent apprendre de nombreuses caractéristiques automatiquement, l'ingénierie des caractéristiques reste un levier important pour les performances des modèles sur les données tabulaires, les séries temporelles et les domaines spécialisés.
Méthodes clés
Les caractéristiques numériques sont transformées par normalisation et mise à l'échelle. Les variables catégorielles sont encodées (one-hot, target encoding, embeddings). Les caractéristiques temporelles extraient tendances, saisonnalité et schémas cycliques. Les caractéristiques d'interaction combinent les informations de plusieurs variables.
Feature Stores
Pour le ML en entreprise, les feature stores gèrent centralement les caractéristiques calculées, assurent la cohérence entre entraînement et inférence, permettent la réutilisation des caractéristiques entre projets et suivent la provenance des caractéristiques pour l'auditabilité. Un feature store évite le biais entraînement-service, source commune d'échecs IA en production.