Semantično vs. iskanje po ključnih besedah
Tradicionalno iskanje (BM25, TF-IDF) išče dobesedna ujemanja ključnih besed. Semantično iskanje z vektorji vdelanih prikazov zajame pomen — iskanje razume, da sta »okvara avtomobila« in »težava z vozilom« semantično enakovredni.
Arhitektura semantičnega iskanja
Faza brez povezave: dokumenti se vdelajo in indeksirajo v vektorsko bazo. Faza s povezavo: poizvedba uporabnika se vdela, iskanje ANN najde K najbližjih vektorjev, prerazvrstitveni model izboljša relevantnost.
Hibridno iskanje
Za produkcijsko iskanje kombinacija redkega (BM25) + gostega (vektorskega) pristopa daje superiorne rezultate. Ta »hibridni« pristop je de facto standard za moderne iskalnike v podjetjih.