Kaj je vektorska podatkovna baza?
Vektorska podatkovna baza je specializirana podatkovna baza, optimizirana za shranjevanje, indeksiranje in iskanje vektorjev — večdimenzionalnih numeričnih reprezentacij besedila, slik ali zvoka. Primeri: Qdrant, Pinecone, Weaviate, Milvus, pgvector.
Kako vektorji delujejo?
Model za embedanje pretvori besedilo v vektor (npr. 1.536 števil). Semantično podobna besedila imajo "bližnje" vektorje v večdimenzionalnem prostoru. Poizvedba "pisarna v Ljubljani" bo blizu "poslovni prostor prestolnica" kljub različnim besedam — ker je njun pomen podoben.
Vloga v RAG
Vektorske podatkovne baze so temelj arhitekture RAG: dokumenti se razdelijo na odseke, pretvorijo v vektorje in indeksirajo. Ob poizvedbi sistem najde najustreznejše fragmente in jih zagotovi modelu kot kontekst.