Tunnuste inseneeria mõistmine
Tunnuste inseneeria on protsess domeenispetsiifiliste teadmiste kasutamiseks tunnuste loomiseks toortele andmetest, mida ML mudelid saavad paremini ära kasutada. Tunnuste hea valik võib mudeli jõudluses otsustava rolli mängida — paremate tunnustega saavad lihtsamad mudelid keerulised mudelid halvema tunnustega ületada.
Tunnuste inseneeria tehnikad
Arvulised transformatsioonid hõlmavad normaliseerimist, standardiseerimist ja logaritmilisi transformatsioone. Kategorialine kodeerimine rakendab ühe-kuuma, sihtmärgi või manustamise kodeerimist. Tekstifunktsioonide puhul kaalutakse kott-sõnade, TF-IDF ja manustamispõhiseid lähenemisi. Ajaridajate puhul on asjakohased tagasivaatavad tunnused ja libisevad keskmised.
Automatiseeritud tunnuste inseneeria
Automatiseeritud tunnuste inseneeria (AutoFE) tööriistad saavad vähendada käsitsi tööd, uurides süstemaatiliselt andmete transformatsioone. Need tööriistad ei asenda käsitsi tööd — domeeni mõistmine jääb kriitiliseks — vaid täiendavad seda.