Kaj je označevanje podatkov?
Označevanje podatkov je proces dodajanja metapodatkov ali oznak surovim podatkom — besedilu, slikam, videu, zvoku — da se modeli UI učijo iz primerov. Vsaka kategorija modela UI zahteva drugačen tip anotacije.
Metode anotacije
Ročna anotacija: človeški anotatorji — največja točnost, a drago. Množično sourcing: platforme za razširljivost. Pol-nadzorovano učenje: modeli anotirajo, ljudje preverijo.
Kakovost in upravljanje
Kakovost anotacije neposredno določa kakovost modela. Ukrepi za zagotavljanje: smernice za anotatorje, metrike soglasja med ocenjevalci in iterativno izboljšanje.