Retour au glossaire Technologie

Recherche dans une Base de Données Vectorielle

La recherche dans des bases de données vectorielles de contenus sémantiquement similaires à l'aide de vecteurs d'embedding.

Qu'est-ce que la recherche dans une base de données vectorielle ?

La recherche dans une base de données vectorielle (Vector Retrieval) est l'opération centrale dans les systèmes IA modernes, où les requêtes sont représentées sous forme de vecteurs et les contenus sémantiquement similaires sont trouvés dans un index vectoriel. Contrairement à la recherche par mots-clés, elle trouve des contenus conceptuellement liés, même en l'absence de correspondances exactes de mots.

Implémentation technique

Les modèles d'embedding (p. ex. OpenAI Embeddings, Cohere Embed, E5) convertissent le texte en vecteurs haute dimension. Les algorithmes de voisin le plus proche approximatif (ANN) comme HNSW (Hierarchical Navigable Small World) ou IVF (Inverted File Index) permettent des recherches rapides dans des millions ou milliards de vecteurs. Des bases de données spécialisées comme Pinecone, Weaviate, Qdrant et pgvector optimisent ces opérations.

Usage en entreprise

La recherche vectorielle est la base de la recherche sémantique, des systèmes RAG, des systèmes de recommandation et de la recherche par similarité en entreprise. Le choix de la dimensionnalité de l'embedding, de l'algorithme ANN et de l'architecture de la base de données influence directement les latences de recherche, la qualité du rappel et les coûts opérationnels.