Nazaj na slovar MLOps & Življenjski cikel

Označevanje podatkov (anotacija)

Proces ročnega ali samodejnega označevanja podatkov za učenje modelov UI — temelj nadzorovanega učenja.

Kaj je označevanje podatkov?

Označevanje podatkov je proces dodajanja metapodatkov ali oznak surovim podatkom — besedilu, slikam, videu, zvoku — da se modeli UI učijo iz primerov. Vsaka kategorija modela UI zahteva drugačen tip anotacije.

Metode anotacije

Ročna anotacija: človeški anotatorji — največja točnost, a drago. Množično sourcing: platforme za razširljivost. Pol-nadzorovano učenje: modeli anotirajo, ljudje preverijo.

Kakovost in upravljanje

Kakovost anotacije neposredno določa kakovost modela. Ukrepi za zagotavljanje: smernice za anotatorje, metrike soglasja med ocenjevalci in iterativno izboljšanje.