Czym jest baza wektorowa?
Baza wektorowa (ang. vector database) to specjalistyczna baza danych zoptymalizowana do przechowywania, indeksowania i wyszukiwania wektorów — wielowymiarowych reprezentacji liczbowych tekstu, obrazów lub dźwięku. Przykłady: Qdrant, Pinecone, Weaviate, Milvus, pgvector.
Jak działają wektory?
Model embedding zamienia tekst na wektor (np. 1536 liczb). Semantycznie podobne teksty mają "bliskie" wektory w przestrzeni wielowymiarowej. Pytanie "biuro w Warszawie" będzie blisko "lokal biurowy stolica" mimo różnych słów. Baza wektorowa efektywnie wyszukuje najbliższych sąsiadów (ANN — Approximate Nearest Neighbor).
Rola w RAG
Bazy wektorowe to fundament architektury RAG: dokumenty są dzielone na fragmenty (chunks), zamieniane na wektory i indeksowane. Przy zapytaniu system wyszukuje najbardziej relevantne fragmenty i dostarcza je modelowi jako kontekst. Wydajność bazy wektorowej bezpośrednio wpływa na jakość odpowiedzi RAG.