Què és el Fine-tuning?
El Fine-tuning és el procés de reentrenar un model d'IA preentrenat amb un conjunt de dades més petit i especialitzat. L'objectiu és adaptar un model fundacional a un domini específic (p. ex. dret, medicina, finances) o tasca (p. ex. classificació, extracció de dades, generació d'informes).
Tècniques de fine-tuning
Fine-tuning complet — reentrenament de tots els paràmetres del model (car, requereix GPU). LoRA/QLoRA — adaptació de baix rang, entrenament d'un petit subconjunt de paràmetres (10-100x més econòmic). Instruction tuning — entrenament amb parells instrucció-resposta. RLHF — aprenentatge a partir de retroalimentació humana.
Quan fine-tuning, quan RAG?
Fine-tuning: quan voleu canviar l'estil, format o especialització del model. RAG: quan necessiteu dades actuals (documents que canvien). A l'empresa, habitualment es combinen: model amb fine-tuning + RAG de la base de coneixement corporativa.