Tunnuste inseneeria (Feature Engineering)

Tunnuste inseneeria mõistmine

Tunnuste inseneeria on protsess domeenispetsiifiliste teadmiste kasutamiseks tunnuste loomiseks toortele andmetest, mida ML mudelid saavad paremini ära kasutada. Tunnuste hea valik võib mudeli jõudluses otsustava rolli mängida — paremate tunnustega saavad lihtsamad mudelid keerulised mudelid halvema tunnustega ületada.

Tunnuste inseneeria tehnikad

Arvulised transformatsioonid hõlmavad normaliseerimist, standardiseerimist ja logaritmilisi transformatsioone. Kategorialine kodeerimine rakendab ühe-kuuma, sihtmärgi või manustamise kodeerimist. Tekstifunktsioonide puhul kaalutakse kott-sõnade, TF-IDF ja manustamispõhiseid lähenemisi. Ajaridajate puhul on asjakohased tagasivaatavad tunnused ja libisevad keskmised.

Automatiseeritud tunnuste inseneeria

Automatiseeritud tunnuste inseneeria (AutoFE) tööriistad saavad vähendada käsitsi tööd, uurides süstemaatiliselt andmete transformatsioone. Need tööriistad ei asenda käsitsi tööd — domeeni mõistmine jääb kriitiliseks — vaid täiendavad seda.

Tunnuste inseneeria mõistmine

Tunnuste inseneeria tehnikad

Automatiseeritud tunnuste inseneeria

Seotud mõisted