Zero-Shot a Few-Shot Learning

Co je zero-shot learning?

Zero-shot learning popisuje schopnost AI modelu vyknavat ulohy, ktore neboli zahrnuté v jeho trenovaní – len na zaklade popisulohy v prirodzenom jazyku. "Preloz tento text do swahilcsiny" alebo "Klasifikuj tuto recenziu ako Pozitivna/Negativna/Neutralna" – bez jediného prikladu.

Tato schopnost je jednym z najvyznamnejsich prejavov inteligencia LLM a dramaticky znizuje potrebu specialovaneho fine-tuningu pre kazdu novu ulohu.

Few-shot learning

Few-shot learning rozsiruje zero-shot o niekolko demonstracnych prikladov (typicky 1-10) v prompte. Modely nauce sa z tychto prikladov "on the fly" pocas inferencie – nie cez optimalizaciu vahovych parametrov, ale cez in-context learning.

Priklady su strukturovane ako input-output pary: "Vstup: [priklad1], Vystup: [odpoved1]. Vstup: [priklad2], Vystup: [odpoved2]. Vstup: [novy vstup], Vystup: ?"

Kedy pouzit zero vs. few-shot?

Zero-shot funguje dobre pre jednoduche, dobre definovane ulohy, kde staci popis. Few-shot je uzitocny, ked format odpovede nie je standardny, uloha je specificka pre danu domenu, alebo null-shot vysledky su nespolahlivé. Chain-of-Thought few-shot (ukaz priklad uvazovanie + odpovede) casto dramaticky zlepsuje vykon na logickych ulohách.

Co je zero-shot learning?

Few-shot learning

Kedy pouzit zero vs. few-shot?

Súvisiace pojmy