Τι είναι το Retrieval;
Το retrieval (ανάκτηση πληροφοριών) αναφέρεται στη διαδικασία εύρεσης σχετικού περιεχομένου από μια βάση γνώσης βάσει ενός ερωτήματος. Σε RAG συστήματα, το retrieval είναι το πρώτο βήμα: η ερώτηση χρήστη μετατρέπεται σε embedding, το οποίο συγκρίνεται με embeddings αποθηκευμένων εγγράφων για εύρεση σχετικών αποσπασμάτων.
Η ποιότητα retrieval καθορίζει άμεσα την ποιότητα RAG — «garbage in, garbage out».
Τεχνικές Ανάκτησης
Dense retrieval χρησιμοποιεί embeddings για σημασιολογική ομοιότητα. Sparse retrieval (BM25, TF-IDF) βασίζεται σε λέξεις-κλειδιά. Hybrid retrieval συνδυάζει και τις δύο προσεγγίσεις για καλύτερα αποτελέσματα. Η επιλογή εξαρτάται από φύση ερωτημάτων και χαρακτηριστικά βάσης γνώσης.
Βελτιστοποίηση
Βελτιστοποίηση retrieval: chunking strategy (πώς διαιρούνται τα έγγραφα), επιλογή embedding μοντέλου, filtering μεταδεδομένων για προ-φιλτράρισμα, query expansion (επέκταση ερωτήματος) και reranking αποτελεσμάτων.