Miért szükséges a reranking?
A hagyományos RAG-rendszerek vektoros hasonlóság-alapú visszakeresést alkalmaznak, amely erősen összefügg a szövegek lexikai és szemantikai hasonlóságával. Azonban a legközelebbi vektoros szomszédok nem feltétlenül a leginkább releváns dokumentumok egy adott kérdéshez. A reranking pontosabb relevanciaszámítást alkalmaz a lekért jelöltek kisebb halmazán, ami számításilag kezelhetőbb.
Reranking megközelítések
A cross-encoder rerankerek egyszerre kódolják a kérdés-dokumentum párokat, lehetővé téve a közvetlen összehasonlítást, de lassabbak. A bi-encoder rerankerek a kérdések és dokumentumok önálló vektorizálásán alapulnak, gyorsabb, de kevésbé pontos. Az LLM-alapú reranking prompt-alapú kéréseket küld az LLM-nek a dokumentum relevanciájának értékelésére.
Vállalati megvalósítás
A reranking általában behelyezhető a RAG-pipeline-ba a kezdeti visszakeresés és a végső generálás közé. Az optimális reranker és a top-k küszöbértékek alkalmazásfüggők. Értékelje a réteg relevanciás pontszámait a végső eredményen és az emberi értékelőn.