Glosategiara itzuli Teknologia

Fine-tuning

AA eredu bat datu espezializatuekin berrentrenatzea — oinarrizko eredu orokor bat domeinu edo zeregin zehatz batera egokitzea.

Zer da Fine-tuning?

Fine-tuning aurrez entrenatutako AA eredu bat datu-multzo txikiago eta espezializatu batekin berrentrenatzeko prozesua da. Helburua oinarrizko eredu bat domeinu zehatz batera (adib. zuzenbidea, medikuntza, finantzak) edo zeregin batera (adib. sailkapena, datuen erauzketa, txostenen sorkuntza) egokitzea da.

Fine-tuning teknikak

Fine-tuning osoa — ereduaren parametro guztiak berrentrenatzea (garestia, GPU behar du). LoRA/QLoRA — maila baxuko egokitzapena, parametro azpimultzo txiki bat entrenatzea (10-100x merkeagoa). Instruction tuning — instrukzio-erantzun bikoteekin entrenatzea. RLHF — giza feedbacketik ikastea.

Noiz fine-tuning, noiz RAG?

Fine-tuning: ereduaren estiloa, formatua edo espezializazioa aldatu nahi duzunean. RAG: uneko datuak behar dituzunean (aldatzen diren dokumentuak). Enpresan, normalean biak konbinatzen dira: fine-tuned eredua + enpresako ezagutza-baseko RAG.