Tornar al glossari Tecnologia

Fine-tuning

Reentrenament d'un model d'IA amb dades especialitzades — adaptació d'un model fundacional general a un domini o tasca específics.

Què és el Fine-tuning?

El Fine-tuning és el procés de reentrenar un model d'IA preentrenat amb un conjunt de dades més petit i especialitzat. L'objectiu és adaptar un model fundacional a un domini específic (p. ex. dret, medicina, finances) o tasca (p. ex. classificació, extracció de dades, generació d'informes).

Tècniques de fine-tuning

Fine-tuning complet — reentrenament de tots els paràmetres del model (car, requereix GPU). LoRA/QLoRA — adaptació de baix rang, entrenament d'un petit subconjunt de paràmetres (10-100x més econòmic). Instruction tuning — entrenament amb parells instrucció-resposta. RLHF — aprenentatge a partir de retroalimentació humana.

Quan fine-tuning, quan RAG?

Fine-tuning: quan voleu canviar l'estil, format o especialització del model. RAG: quan necessiteu dades actuals (documents que canvien). A l'empresa, habitualment es combinen: model amb fine-tuning + RAG de la base de coneixement corporativa.