Zakaj je prerazvrstitev pomembna?
Začetno iskanje v sistemih RAG optimizira hitrost — primerno za pridobivanje top-K kandidatov, a ne za fino razvrščanje po relevantnosti. Prerazvrstitveni model analizira vsak par (poizvedba, kandidat) in jih razvrsti po natančni semantični relevantnosti.
Arhitektura RAG s prerazvrstitvijo
1. Vektorsko iskanje pridobi top-50 kandidatov. 2. Prerazvrstitveni modeli (Cohere Rerank, BGE) ocenijo vsakega kandidata. 3. Top-5–10 visoko razvrščenih rezultatov vstopi v kontekst LLM.
Implementacija
Priljubljeni pristopi prerazvrstitve: navzkrižno-kodirani modeli, bi-koder z MMR in API storitve (Cohere Rerank). Prerazvrstitev je izboljšava z visokim ROI za sisteme RAG z nepomembnimi odgovori.