Tagasi sõnastikku Tehnoloogia

Vektorandmebaas

Spetsialiseeritud andmebaas, mis salvestab andmeid numbriliste vektoritena — võimaldab "sarnase" sisu semantilist otsingut.

Mis on vektorandmebaas?

Vektorandmebaas on spetsialiseeritud andmebaas, mis on optimeeritud vektorite — teksti, piltide või heli mitmemõõtmeliste numbriliste esituste — salvestamiseks, indekseerimiseks ja otsimiseks. Näited: Qdrant, Pinecone, Weaviate, Milvus, pgvector.

Kuidas vektorid toimivad?

Embedding-mudel teisendab teksti vektoriks (nt 1536 numbrit). Semantiliselt sarnastel tekstidel on mitmemõõtmelises ruumis "lähedased" vektorid. Päring "kontor Tallinnas" on lähedal päringule "äripind pealinn" vaatamata erinevatele sõnadele — sest nende tähendus on sarnane.

Roll RAG-is

Vektorandmebaasid on RAG-i arhitektuuri alus: dokumendid jagatakse tükkideks, teisendatakse vektoriteks ja indekseeritakse. Pärimisel leiab süsteem kõige asjakohasemad fragmendid ja pakub need mudelile kontekstina.