Τι είναι το RAG;
Η Retrieval-Augmented Generation (RAG) συνδυάζει δύο στάδια: ανάκτηση (εύρεση σχετικών εγγράφων από βάση γνώσης) και δημιουργία (παραγωγή απαντήσεων βάσει των ευρημάτων). Το μοντέλο δεν βασίζεται στη μνήμη εκπαίδευσης αλλά σε παρεχόμενα, τρέχοντα δεδομένα.
Πώς λειτουργεί ένα pipeline RAG;
1. Ο χρήστης θέτει μια ερώτηση. 2. Το σύστημα αναζητά σχετικά αποσπάσματα εγγράφων σε μια βάση δεδομένων διανυσμάτων (embedding + αναζήτηση ομοιότητας). 3. Τα ευρήματα προστίθενται στο prompt ως πλαίσιο. 4. Το μοντέλο δημιουργεί απόκριση αναφέροντας πηγές.
RAG vs fine-tuning
Χρησιμοποιήστε RAG όταν τα δεδομένα αλλάζουν (βάση γνώσης, τεκμηρίωση, κανονισμοί). Χρησιμοποιήστε fine-tuning όταν θέλετε να αλλάξετε τη συμπεριφορά του μοντέλου (στυλ απόκρισης, μορφή, εξειδίκευση τομέα). Στην επιχειρηματική πρακτική, συνήθως συνδυάζονται και οι δύο προσεγγίσεις.