Επιστροφή στο γλωσσάριο Τεχνολογία

RAG (Retrieval-Augmented Generation)

Τεχνική που συνδυάζει ανάκτηση πληροφοριών με δημιουργία — η ΤΝ απαντά βάσει τρεχόντων εγγράφων, όχι μόνο της «μνήμης» της.

Τι είναι το RAG;

Η Retrieval-Augmented Generation (RAG) συνδυάζει δύο στάδια: ανάκτηση (εύρεση σχετικών εγγράφων από βάση γνώσης) και δημιουργία (παραγωγή απαντήσεων βάσει των ευρημάτων). Το μοντέλο δεν βασίζεται στη μνήμη εκπαίδευσης αλλά σε παρεχόμενα, τρέχοντα δεδομένα.

Πώς λειτουργεί ένα pipeline RAG;

1. Ο χρήστης θέτει μια ερώτηση. 2. Το σύστημα αναζητά σχετικά αποσπάσματα εγγράφων σε μια βάση δεδομένων διανυσμάτων (embedding + αναζήτηση ομοιότητας). 3. Τα ευρήματα προστίθενται στο prompt ως πλαίσιο. 4. Το μοντέλο δημιουργεί απόκριση αναφέροντας πηγές.

RAG vs fine-tuning

Χρησιμοποιήστε RAG όταν τα δεδομένα αλλάζουν (βάση γνώσης, τεκμηρίωση, κανονισμοί). Χρησιμοποιήστε fine-tuning όταν θέλετε να αλλάξετε τη συμπεριφορά του μοντέλου (στυλ απόκρισης, μορφή, εξειδίκευση τομέα). Στην επιχειρηματική πρακτική, συνήθως συνδυάζονται και οι δύο προσεγγίσεις.

Σχετικές υπηρεσίες και προϊόντα