Cos'è un database vettoriale?
Un database vettoriale è un database specializzato ottimizzato per la memorizzazione, l'indicizzazione e la ricerca di vettori — rappresentazioni numeriche multidimensionali di testo, immagini o audio. Esempi: Qdrant, Pinecone, Weaviate, Milvus, pgvector.
Come funzionano i vettori?
Un modello di embedding converte il testo in un vettore (ad es. 1 536 numeri). Testi semanticamente simili hanno vettori «vicini» nello spazio multidimensionale. La query «ufficio a Varsavia» sarà vicina a «locali commerciali capitale» nonostante parole diverse — perché il loro significato è simile.
Ruolo nel RAG
I database vettoriali sono il fondamento dell'architettura RAG: i documenti vengono suddivisi in chunk, convertiti in vettori e indicizzati. Durante una query, il sistema trova i frammenti più rilevanti e li fornisce al modello come contesto.