Reranking

Was ist Reranking?

Reranking ist eine Technik zur Verbesserung von Retrieval-Systemen, bei der zuerst eine große Menge von Kandidaten (z.B. 100 Dokumente) mit einem schnellen, aber weniger präzisen Retrieval-Verfahren abgerufen wird. Anschließend ordnet ein genaueres Cross-Encoder-Modell diese Kandidaten basierend auf ihrer tatsächlichen Relevanz zur Anfrage neu.

Technische Details

Bi-Encoder-Modelle (z.B. sentence-transformers) sind schnell für die erste Phase, da sie Query und Dokument unabhängig codieren. Cross-Encoder-Modelle (z.B. Cohere Rerank, BGE-Reranker) berücksichtigen die Interaktion zwischen Query und Dokument und sind genauer, aber langsamer. Diese zweistufige Pipeline bietet das beste Gleichgewicht aus Geschwindigkeit und Qualität.

RAG-Anwendungen

In RAG-Systemen verbessert Reranking die Qualität des an LLMs übergebenen Kontexts erheblich. Studien zeigen, dass Reranking die RAG-Antwortqualität um 20–40% verbessern kann. Es ist besonders wichtig bei großen Wissensbasen und fachspezifischen Abfragen, wo einfaches Similarity-Scoring oft unzureichend ist.

Was ist Reranking?

Technische Details

RAG-Anwendungen

Verwandte Begriffe