Τι είναι το Fine-tuning;
Το Fine-tuning είναι η διαδικασία επανεκπαίδευσης ενός προεκπαιδευμένου μοντέλου ΤΝ σε μικρότερο, εξειδικευμένο σύνολο δεδομένων. Ο στόχος είναι η προσαρμογή ενός θεμελιώδους μοντέλου σε συγκεκριμένο τομέα (π.χ. νομικά, ιατρική, χρηματοοικονομικά) ή εργασία (π.χ. ταξινόμηση, εξαγωγή δεδομένων, δημιουργία αναφορών).
Τεχνικές fine-tuning
Πλήρες fine-tuning — επανεκπαίδευση όλων των παραμέτρων του μοντέλου (ακριβό, απαιτεί GPU). LoRA/QLoRA — προσαρμογή χαμηλής τάξης, εκπαίδευση μικρού υποσυνόλου παραμέτρων (10-100x φθηνότερο). Instruction tuning — εκπαίδευση σε ζεύγη οδηγία-απόκριση. RLHF — μάθηση από ανθρώπινη ανατροφοδότηση.
Πότε fine-tuning, πότε RAG;
Fine-tuning: όταν θέλετε να αλλάξετε στυλ, μορφή ή εξειδίκευση μοντέλου. RAG: όταν χρειάζεστε τρέχοντα δεδομένα (μεταβαλλόμενα έγγραφα). Στην επιχείρηση, συνήθως συνδυάζονται: μοντέλο με fine-tuning + RAG από εταιρική βάση γνώσης.