Mitä on vektoritietokanta?
Vektoritietokanta on erikoistunut tietokanta, joka on optimoitu vektorien — tekstin, kuvien tai äänen moniulotteisten numeeristen esitysten — tallentamiseen, indeksointiin ja hakuun. Esimerkkejä: Qdrant, Pinecone, Weaviate, Milvus, pgvector.
Miten vektorit toimivat?
Embedding-malli muuntaa tekstin vektoriksi (esim. 1 536 lukua). Semanttisesti samankaltaisilla teksteillä on "läheiset" vektorit moniulotteisessa avaruudessa. Kysely "toimisto Helsingissä" on lähellä "liiketilat pääkaupunki" eri sanoista huolimatta — koska niiden merkitys on samankaltainen.
Rooli RAG:ssa
Vektoritietokannat ovat RAG-arkkitehtuurin perusta: dokumentit jaetaan osiin, muunnetaan vektoreiksi ja indeksoidaan. Kyselyn yhteydessä järjestelmä löytää relevantimmat fragmentit ja tarjoaa ne mallille kontekstiksi.