Qu'est-ce qu'une base de données vectorielle ?
Une base de données vectorielle est une base de données spécialisée optimisée pour le stockage, l'indexation et la recherche de vecteurs — des représentations numériques multidimensionnelles de texte, images ou audio. Exemples : Qdrant, Pinecone, Weaviate, Milvus, pgvector.
Comment fonctionnent les vecteurs ?
Un modèle d'embedding convertit le texte en vecteur (par ex. 1 536 nombres). Les textes sémantiquement proches ont des vecteurs « proches » dans l'espace multidimensionnel. La requête « bureau à Varsovie » sera proche de « locaux commerciaux capitale » malgré des mots différents — car leur sens est similaire.
Rôle dans le RAG
Les bases de données vectorielles sont le fondement de l'architecture RAG : les documents sont découpés en fragments, convertis en vecteurs et indexés. Lors d'une requête, le système trouve les fragments les plus pertinents et les fournit au modèle comme contexte.