Επιστροφή στο γλωσσάριο Τεχνολογία

Fine-tuning

Επανεκπαίδευση μοντέλου ΤΝ σε εξειδικευμένα δεδομένα — προσαρμογή ενός γενικού θεμελιώδους μοντέλου σε συγκεκριμένο τομέα ή εργασία.

Τι είναι το Fine-tuning;

Το Fine-tuning είναι η διαδικασία επανεκπαίδευσης ενός προεκπαιδευμένου μοντέλου ΤΝ σε μικρότερο, εξειδικευμένο σύνολο δεδομένων. Ο στόχος είναι η προσαρμογή ενός θεμελιώδους μοντέλου σε συγκεκριμένο τομέα (π.χ. νομικά, ιατρική, χρηματοοικονομικά) ή εργασία (π.χ. ταξινόμηση, εξαγωγή δεδομένων, δημιουργία αναφορών).

Τεχνικές fine-tuning

Πλήρες fine-tuning — επανεκπαίδευση όλων των παραμέτρων του μοντέλου (ακριβό, απαιτεί GPU). LoRA/QLoRA — προσαρμογή χαμηλής τάξης, εκπαίδευση μικρού υποσυνόλου παραμέτρων (10-100x φθηνότερο). Instruction tuning — εκπαίδευση σε ζεύγη οδηγία-απόκριση. RLHF — μάθηση από ανθρώπινη ανατροφοδότηση.

Πότε fine-tuning, πότε RAG;

Fine-tuning: όταν θέλετε να αλλάξετε στυλ, μορφή ή εξειδίκευση μοντέλου. RAG: όταν χρειάζεστε τρέχοντα δεδομένα (μεταβαλλόμενα έγγραφα). Στην επιχείρηση, συνήθως συνδυάζονται: μοντέλο με fine-tuning + RAG από εταιρική βάση γνώσης.