Mis on vektorandmebaas?
Vektorandmebaas on spetsialiseeritud andmebaas, mis on optimeeritud vektorite — teksti, piltide või heli mitmemõõtmeliste numbriliste esituste — salvestamiseks, indekseerimiseks ja otsimiseks. Näited: Qdrant, Pinecone, Weaviate, Milvus, pgvector.
Kuidas vektorid toimivad?
Embedding-mudel teisendab teksti vektoriks (nt 1536 numbrit). Semantiliselt sarnastel tekstidel on mitmemõõtmelises ruumis "lähedased" vektorid. Päring "kontor Tallinnas" on lähedal päringule "äripind pealinn" vaatamata erinevatele sõnadele — sest nende tähendus on sarnane.
Roll RAG-is
Vektorandmebaasid on RAG-i arhitektuuri alus: dokumendid jagatakse tükkideks, teisendatakse vektoriteks ja indekseeritakse. Pärimisel leiab süsteem kõige asjakohasemad fragmendid ja pakub need mudelile kontekstina.