Qu'est-ce que le rerankage ?
Le rerankage est une technique pour améliorer les systèmes de récupération, dans laquelle un grand nombre de candidats (p. ex. 100 documents) est d'abord récupéré avec une procédure de récupération rapide mais moins précise. Un modèle cross-encoder plus précis réordonne ensuite ces candidats en fonction de leur pertinence réelle par rapport à la requête.
Détails techniques
Les modèles bi-encodeurs (p. ex. sentence-transformers) sont rapides pour la première phase, car ils encodent la requête et le document indépendamment. Les modèles cross-encodeurs (p. ex. Cohere Rerank, BGE-Reranker) prennent en compte l'interaction entre la requête et le document et sont plus précis mais plus lents. Ce pipeline en deux étapes offre le meilleur équilibre entre vitesse et qualité.
Applications RAG
Dans les systèmes RAG, le rerankage améliore considérablement la qualité du contexte transmis aux LLM. Des études montrent que le rerankage peut améliorer la qualité des réponses RAG de 20 à 40%. Il est particulièrement important pour les grandes bases de connaissances et les requêtes spécifiques à un domaine, où le scoring de similarité simple est souvent insuffisant.