Fine-tuning

Kas yra Fine-tuning?

Fine-tuning — tai iš anksto apmokyto DI modelio perkvalifikavimo procesas naudojant mažesnį, specializuotą duomenų rinkinį. Tikslas — bazinio modelio pritaikymas konkrečiai sričiai (pvz., teisė, medicina, finansai) ar užduočiai (pvz., klasifikavimas, duomenų išgavimas, ataskaitų generavimas).

Fine-tuningo technikos

Pilnas fine-tuning — visų modelio parametrų perkvalifikavimas (brangu, reikalauja GPU). LoRA/QLoRA — žemo rango adaptacija, mažo parametrų poaibio mokymas (10–100 kartų pigiau). Instruction tuning — mokymas instrukcijos-atsakymo poromis. RLHF — mokymasis iš žmonių atsiliepimų.

Kada fine-tuning, kada RAG?

Fine-tuning: kai norite pakeisti modelio stilių, formatą ar specializaciją. RAG: kai reikia aktualių duomenų (besikeičiantys dokumentai). Verslo aplinkoje dažniausiai derinami abu: suderintas modelis + RAG iš įmonės žinių bazės.

Kas yra Fine-tuning?

Fine-tuningo technikos

Kada fine-tuning, kada RAG?

Susiję terminai

Susijusios paslaugos ir produktai