Miks ümberjärjestamine on vajalik?
Traditsioonilised RAG süsteemid rakendavad vektori sarnasusepõhist otsingut, mis korreleerub tugevalt leksikaalse ja semantilise sarnasusega. Kuid lähimad vektori naabrid ei pruugi olla kõige asjakohasemad dokumendid antud küsimuse jaoks. Ümberjärjestamine rakendab täpsemat asjakohasuse arvutust väiksemale kandidaatide alamhulgale.
Ümberjärjestamise lähenemised
Ristikodeerija ümberjärjestajad kodeerivad korraga küsimuse-dokumendi paare, võimaldades otsest võrdlust, kuid on aeglasemad. Kahe kodeerija ümberjärjestajad tuginevad küsimuste ja dokumentide eraldi vektoriseerimisele, kiiremad, kuid vähem täpsed. LLM-põhine ümberjärjestamine saadab LLM-ile prompiipõhiseid päringuid dokumentide asjakohasuse hindamiseks.
Ettevõtte rakendamine
Ümberjärjestamist saab tavaliselt lisada RAG torujuhtmesse algse otsingu ja lõpliku genereerimise vahele. Hinnake kandidaadiümberjärjestajaid esinduslikke hindamistandardandmekogumitega oma kasutusjuhtumitele.