Što je dohvat informacija za AI?
Dohvat informacija (IR) za AI je skup tehnika za pronalask relevantnih dokumenata i odlomaka iz repozitorija znanja u odgovoru na korisnički upit. Dok tradicionalni IR koristi ključne riječi i BM25, moderni AI-augmentirani IR kombinira leksičke i semantičke tehnike za superiorniji opoziv relevantnih informacija.
Spektar tehnika dohvata
Sparse retrieval: BM25, TF-IDF — brzo, interpretabilno, dobro za ključne pojmove. Dense retrieval: neuronski embeddingsi u vektorskom prostoru — hvata semantičko značenje. Hibridni dohvat: kombinacija sparse + dense s reciprocal rank fusion. Multi-hop retrieval: iterativni dohvat koji slijedi poveznice između dokumenata. Agentic retrieval: AI agent koji autonomno formulira i poboljšava upite za dohvat.
Optimizacija za produkciju
Ključni parametri: veličina i preklapanje chunkova, izbor embedding modela, strategija indeksiranja, K vrijednost za top-K dohvat, hybrid weight (sparse vs dense balans), reranking. Evaluirajte dohvatni sustav neovisno od LLM-a — loš dohvat ne može nadoknaditi ni najmoćniji model.