Επιστροφή στο γλωσσάριο Τεχνολογία

Βάση Δεδομένων Διανυσμάτων

Εξειδικευμένη βάση δεδομένων που αποθηκεύει δεδομένα ως αριθμητικά διανύσματα — επιτρέποντας σημασιολογική αναζήτηση «παρόμοιου» περιεχομένου.

Τι είναι μια Βάση Δεδομένων Διανυσμάτων;

Μια βάση δεδομένων διανυσμάτων είναι εξειδικευμένη βάση βελτιστοποιημένη για αποθήκευση, ευρετηρίαση και αναζήτηση διανυσμάτων — πολυδιάστατων αριθμητικών αναπαραστάσεων κειμένου, εικόνων ή ήχου. Παραδείγματα: Qdrant, Pinecone, Weaviate, Milvus, pgvector.

Πώς λειτουργούν τα διανύσματα;

Ένα μοντέλο embedding μετατρέπει κείμενο σε διάνυσμα (π.χ. 1.536 αριθμοί). Σημασιολογικά παρόμοια κείμενα έχουν «κοντινά» διανύσματα στον πολυδιάστατο χώρο. Το ερώτημα «γραφείο στην Αθήνα» θα είναι κοντά στο «επαγγελματικοί χώροι πρωτεύουσα» παρά τις διαφορετικές λέξεις — γιατί η σημασία τους είναι παρόμοια.

Ρόλος στο RAG

Οι βάσεις διανυσμάτων αποτελούν τη βάση της αρχιτεκτονικής RAG: τα έγγραφα διαιρούνται σε τμήματα, μετατρέπονται σε διανύσματα και ευρετηριάζονται. Κατά την αναζήτηση, το σύστημα βρίσκει τα πιο σχετικά αποσπάσματα και τα παρέχει στο μοντέλο ως πλαίσιο.

Σχετικές υπηρεσίες και προϊόντα