Tagasi sõnastikku MLOps & Elutsükkel

Tunnuste inseneeria (Feature Engineering)

Protsess tunnuste loomiseks toortele andmetest, mis parandavad ML mudelite ennustusvõimsust ja jõudlust.

Tunnuste inseneeria mõistmine

Tunnuste inseneeria on protsess domeenispetsiifiliste teadmiste kasutamiseks tunnuste loomiseks toortele andmetest, mida ML mudelid saavad paremini ära kasutada. Tunnuste hea valik võib mudeli jõudluses otsustava rolli mängida — paremate tunnustega saavad lihtsamad mudelid keerulised mudelid halvema tunnustega ületada.

Tunnuste inseneeria tehnikad

Arvulised transformatsioonid hõlmavad normaliseerimist, standardiseerimist ja logaritmilisi transformatsioone. Kategorialine kodeerimine rakendab ühe-kuuma, sihtmärgi või manustamise kodeerimist. Tekstifunktsioonide puhul kaalutakse kott-sõnade, TF-IDF ja manustamispõhiseid lähenemisi. Ajaridajate puhul on asjakohased tagasivaatavad tunnused ja libisevad keskmised.

Automatiseeritud tunnuste inseneeria

Automatiseeritud tunnuste inseneeria (AutoFE) tööriistad saavad vähendada käsitsi tööd, uurides süstemaatiliselt andmete transformatsioone. Need tööriistad ei asenda käsitsi tööd — domeeni mõistmine jääb kriitiliseks — vaid täiendavad seda.