Grįžti į žodyną Technologijos

Reranking

Antro etapo išgavimo procesas, pertvarkantis paieškos rezultatus naudojant rafinuotesnį modelį aktualumui ir tikslumui pagerinti.

Kas yra Reranking?

Reranking yra technika, gerinanti paieškos ir išgavimo kokybę, taikant antrą, rafinuotesnį aktualumo modelį pradiniam išgautų rezultatų rinkiniui. Tipiškame konvejeryje greitas, bet apytikslis pirmojo etapo išgautūvas (kaip vektorinio panašumo paieška) ištraukia platų kandidatų rinkinį, o tada rerankeris kruopščiai įvertina kiekvieną kandidatą pagal pradinę užklausą, sukurdamas tikslesnį aktualumo rikiavimą. Šis dviejų etapų metodas jungia apytikslės išgavimo greitį su detalaus aktualumo vertinimo tikslumu.

Rerankeris mato tiek užklausą, tiek kiekvieną kandidatų dokumentą kartu, įgalindamas įvertinti smulkų aktualumą, kurį vien įterpimų panašumas gali praleisti.

Kodėl Reranking gerina rezultatus

Pirmojo etapo išgautūvai, paremti įterpimų panašumu, yra greitį, bet netobuli. Jie kartais iškelia rezultatus, kurie yra temiškai susiję, bet iš tiesų neatsako į užklausą, arba praleidžia subtilius aktualumo signalus ilgesniuose dokumentuose. Rerankeriai, paprastai kryžminių koduotuvų modeliai, apdoroja užklausą ir dokumentą kartu per Transformer, fiksuodami niuansuotas sąveikas tarp užklausos terminų ir dokumento turinio, kurių nepriklausomi įterpimai negali atvaizduoti.

Praktikoje Reranking nuosekliai pagerina išgavimo metrikas 5–15 % ar daugiau, kas viršta pastebimai geresnius DI atsakymus RAG programose.

Įdiegimas RAG konvejeriuose

Dėkite rerankerį tarp išgavimo ir generavimo: išgaukite didesnį pradinį rinkinį (50–100 kandidatų), perranking, tada perduokite geriausius rezultatus kalbos modeliui. Tai gerina kokybę nekeičiant generavimo modelio. Balansuokite reranking kokybę prieš delsą – kryžminių koduotuvų modeliai yra lėtesni už įterpimų paiešką, todėl optimizuokite partijų dydžius ir apsvarstykite modelio distiliavimą jautraus delsos programoms. Vertinkite rerankerius savo srities užklausomis, nes našumas skiriasi per sritis. Junkite reranking su metaduomenų filtravimu ir įvairovės kontrole geriausiam rezultatui. Stebėkite rerankerio našumą laike, nes jūsų turinys ir užklauso šablonai evoliucionuoja.