Kas yra Fine-tuning?
Fine-tuning — tai iš anksto apmokyto DI modelio perkvalifikavimo procesas naudojant mažesnį, specializuotą duomenų rinkinį. Tikslas — bazinio modelio pritaikymas konkrečiai sričiai (pvz., teisė, medicina, finansai) ar užduočiai (pvz., klasifikavimas, duomenų išgavimas, ataskaitų generavimas).
Fine-tuningo technikos
Pilnas fine-tuning — visų modelio parametrų perkvalifikavimas (brangu, reikalauja GPU). LoRA/QLoRA — žemo rango adaptacija, mažo parametrų poaibio mokymas (10–100 kartų pigiau). Instruction tuning — mokymas instrukcijos-atsakymo poromis. RLHF — mokymasis iš žmonių atsiliepimų.
Kada fine-tuning, kada RAG?
Fine-tuning: kai norite pakeisti modelio stilių, formatą ar specializaciją. RAG: kai reikia aktualių duomenų (besikeičiantys dokumentai). Verslo aplinkoje dažniausiai derinami abu: suderintas modelis + RAG iš įmonės žinių bazės.