Reranking

Po co reranking?

Reranking to technika poprawy jakości wyszukiwania semantycznego poprzez ponowne posortowanie wyników przez wyspecjalizowany model. Wyszukiwanie wektorowe (pierwszy etap) jest szybkie, ale przybliżone — porównuje embeddingi, nie analizuje głęboko treści. Reranker (drugi etap) bierze pytanie i każdy wynik, analizuje je razem i ocenia trafność z dużo większą precyzją. To jak różnica między przejrzeniem okładek książek a przeczytaniem streszczeń.

Jak działa reranking?

Pipeline wyszukiwania z rerankingiem: (1) wyszukiwanie wektorowe zwraca top-K wyników (np. 50–100), (2) reranker analizuje każdy wynik w kontekście pytania i przypisuje score trafności, (3) wyniki są sortowane wg nowego score'u, (4) top-N (np. 5–10) trafia do modelu LLM jako kontekst. Reranker jest wolniejszy niż wyszukiwanie wektorowe (analizuje pary tekst-pytanie), ale przetwarza tylko wstępnie odfiltrowane wyniki, więc nie wpływa istotnie na latencję.

Wpływ na jakość RAG

Dodanie rerankingu do pipeline'u RAG poprawia trafność o 15–30% — to jeden z najskuteczniejszych sposobów poprawy jakości bez zmiany modelu generatywnego. Reranking jest szczególnie wartościowy gdy: dokumenty w bazie są podobne tematycznie (np. regulaminy, procedury), pytania są niejednoznaczne, baza wiedzy jest duża (tysiące dokumentów) lub wymagana jest wysoka precyzja (compliance, audyt). Cross-encoder rerankers osiągają najlepsze wyniki, ale modele specjalizowane (Cohere Rerank, BGE Reranker) oferują dobry balans jakości i wydajności.

Po co reranking?

Jak działa reranking?

Wpływ na jakość RAG

Powiązane pojęcia