Kas ir vektoru datubāze?
Vektoru datubāze ir specializēta datubāze, kas optimizēta vektoru — teksta, attēlu vai audio daudzdimensiju skaitlisko attēlojumu — glabāšanai, indeksēšanai un meklēšanai. Piemēri: Qdrant, Pinecone, Weaviate, Milvus, pgvector.
Kā vektori darbojas?
Embedding modelis pārveido tekstu vektorā (piemēram, 1536 skaitļi). Semantiski līdzīgiem tekstiem ir "tuvi" vektori daudzdimensiju telpā. Vaicājums "birojs Rīgā" būs tuvu vaicājumam "komercplatība galvaspilsēta" neskatoties uz atšķirīgiem vārdiem — jo to nozīme ir līdzīga.
Loma RAG
Vektoru datubāzes ir RAG arhitektūras pamats: dokumenti tiek sadalīti fragmentos, pārveidoti vektoros un indeksēti. Vaicājuma laikā sistēma atrod visatbilstošākos fragmentus un nodrošina tos modelim kā kontekstu.