Mi az a vektoradatbázis?
A vektoradatbázis egy specializált adatbázis, amely vektorok — szövegek, képek vagy hangok többdimenziós numerikus reprezentációinak — tárolására, indexelésére és keresésére van optimalizálva. Példák: Qdrant, Pinecone, Weaviate, Milvus, pgvector.
Hogyan működnek a vektorok?
Egy embedding modell a szöveget vektorrá alakítja (pl. 1 536 szám). A szemantikailag hasonló szövegek „közeli" vektorokkal rendelkeznek a többdimenziós térben. Az „iroda Budapesten" lekérdezés közel lesz az „üzleti helyiség főváros" kifejezéshez a különböző szavak ellenére — mert a jelentésük hasonló.
Szerep a RAG-ban
A vektoradatbázisok a RAG-architektúra alapjai: a dokumentumokat részekre bontják, vektorokká alakítják és indexelik. Lekérdezéskor a rendszer megtalálja a legrelevánsabb részleteket és kontextusként biztosítja őket a modellnek.