Takaisin sanastoon Teknologia

Vektoritietokanta

Erikoistunut tietokanta, joka tallentaa dataa numeerisina vektoreina — mahdollistaa semanttisen haun "samankaltaista" sisältöä.

Mitä on vektoritietokanta?

Vektoritietokanta on erikoistunut tietokanta, joka on optimoitu vektorien — tekstin, kuvien tai äänen moniulotteisten numeeristen esitysten — tallentamiseen, indeksointiin ja hakuun. Esimerkkejä: Qdrant, Pinecone, Weaviate, Milvus, pgvector.

Miten vektorit toimivat?

Embedding-malli muuntaa tekstin vektoriksi (esim. 1 536 lukua). Semanttisesti samankaltaisilla teksteillä on "läheiset" vektorit moniulotteisessa avaruudessa. Kysely "toimisto Helsingissä" on lähellä "liiketilat pääkaupunki" eri sanoista huolimatta — koska niiden merkitys on samankaltainen.

Rooli RAG:ssa

Vektoritietokannat ovat RAG-arkkitehtuurin perusta: dokumentit jaetaan osiin, muunnetaan vektoreiksi ja indeksoidaan. Kyselyn yhteydessä järjestelmä löytää relevantimmat fragmentit ja tarjoaa ne mallille kontekstiksi.

Liittyvät palvelut ja tuotteet