Επιστροφή στο γλωσσάριο Τεχνολογία

Retrieval (Ανάκτηση Πληροφοριών)

Η διαδικασία εύρεσης και επιστροφής σχετικών πληροφοριών από μεγάλες βάσεις δεδομένων ή αποθετήρια γνώσης, κεντρικό στοιχείο αρχιτεκτονικών RAG.

Τι είναι το Retrieval;

Το retrieval (ανάκτηση πληροφοριών) αναφέρεται στη διαδικασία εύρεσης σχετικού περιεχομένου από μια βάση γνώσης βάσει ενός ερωτήματος. Σε RAG συστήματα, το retrieval είναι το πρώτο βήμα: η ερώτηση χρήστη μετατρέπεται σε embedding, το οποίο συγκρίνεται με embeddings αποθηκευμένων εγγράφων για εύρεση σχετικών αποσπασμάτων.

Η ποιότητα retrieval καθορίζει άμεσα την ποιότητα RAG — «garbage in, garbage out».

Τεχνικές Ανάκτησης

Dense retrieval χρησιμοποιεί embeddings για σημασιολογική ομοιότητα. Sparse retrieval (BM25, TF-IDF) βασίζεται σε λέξεις-κλειδιά. Hybrid retrieval συνδυάζει και τις δύο προσεγγίσεις για καλύτερα αποτελέσματα. Η επιλογή εξαρτάται από φύση ερωτημάτων και χαρακτηριστικά βάσης γνώσης.

Βελτιστοποίηση

Βελτιστοποίηση retrieval: chunking strategy (πώς διαιρούνται τα έγγραφα), επιλογή embedding μοντέλου, filtering μεταδεδομένων για προ-φιλτράρισμα, query expansion (επέκταση ερωτήματος) και reranking αποτελεσμάτων.