Reranking

Co je reranking?

Reranking je technika retrieval, ktera prida druhou fazi hodnoceni k pocatecnim vysledkum vyhledavani. Pocatecni vyhledavani (casto embedding-zalozene vektorove vyhledavani) rych vrati velkou sadu kandidatu z obrovskych databazi. Reranker potom aplikuje vice vypocetne narocny model -- typicky cross-encoder -- ke kazde par dotaz-dokument a vytvori jemnejsi score relevance zachycujici slozitejsi semanticke vztahy nezachycene rychlym kandidatnim vyhledavanim.

Jak reranking zlepsuje RAG

Vektorove vyhledavani vyniklo ve zpracovani v realnem case prekladem textu na embedding vektory a hledanim nejblizsi sousedy, ale jsou pristupne pouze na reprezentacnich podobnostech. Cross-encodery pouzivane pro reranking zpracovavaji dotaz a dokument soucasne, zachycujici krizove interakce, ktere bi-encoder modely misi. Tato druha faze hodnoceni typicky zlepsi presnost vyhledavani o 20-30 % na standardnich benchmarkch a muze vyrazne redukovat halucinace v RAG sistemech poskytovanim LLM vyrazne relevantnijsiho kontextu.

Implementacni uvazeni

Reranking prida latenci od desatek po stovky milisekund v zavislosti na velikosti modelu. Pre primerene optimalizaci pouzivejte lehci modely pro real-time aplikace a hlubsi modely kde je dostupna nizka latence. Vyberte velikost top-k kandidatnu uvazlive -- prilis malo kandidatu muze zpusobit, ze reranker zesintra, zatimco prilis mnoho jich naklady na pocitani roste linearnejsi.

Co je reranking?

Jak reranking zlepsuje RAG

Implementacni uvazeni

Související pojmy