Povratak na rječnik Tehnologija

Dohvat informacija za AI (Information Retrieval)

Tehnika pronalaska relevantnih dokumenata, odlomaka i podataka iz repozitorija znanja — temelj RAG sustava i AI agenata koji koriste vanjske izvore.

Što je dohvat informacija za AI?

Dohvat informacija (IR) za AI je skup tehnika za pronalask relevantnih dokumenata i odlomaka iz repozitorija znanja u odgovoru na korisnički upit. Dok tradicionalni IR koristi ključne riječi i BM25, moderni AI-augmentirani IR kombinira leksičke i semantičke tehnike za superiorniji opoziv relevantnih informacija.

Spektar tehnika dohvata

Sparse retrieval: BM25, TF-IDF — brzo, interpretabilno, dobro za ključne pojmove. Dense retrieval: neuronski embeddingsi u vektorskom prostoru — hvata semantičko značenje. Hibridni dohvat: kombinacija sparse + dense s reciprocal rank fusion. Multi-hop retrieval: iterativni dohvat koji slijedi poveznice između dokumenata. Agentic retrieval: AI agent koji autonomno formulira i poboljšava upite za dohvat.

Optimizacija za produkciju

Ključni parametri: veličina i preklapanje chunkova, izbor embedding modela, strategija indeksiranja, K vrijednost za top-K dohvat, hybrid weight (sparse vs dense balans), reranking. Evaluirajte dohvatni sustav neovisno od LLM-a — loš dohvat ne može nadoknaditi ni najmoćniji model.