Fundament inteligentnych systemów
Retrieval (wyszukiwanie informacji) to proces odnajdywania relevantnych dokumentów, fragmentów tekstu lub danych w odpowiedzi na zapytanie. W architekturze RAG (Retrieval-Augmented Generation) retrieval jest kluczowym pierwszym etapem — jakość pobranych informacji determinuje jakość odpowiedzi generowanej przez model AI. Skuteczny retrieval łączy szybkość (milisekundy na milionach dokumentów) z trafnością (zwraca to, czego naprawdę szuka użytkownik).
Metody wyszukiwania
Sparse retrieval (BM25, TF-IDF) — klasyczne wyszukiwanie oparte na częstotliwości słów, szybkie i efektywne dla dokładnych dopasowań. Dense retrieval — wyszukiwanie wektorowe oparte na embeddingach, rozumie semantykę pytania. Hybrid retrieval — łączy oba podejścia (np. BM25 + wektory z fuzją wyników), zazwyczaj daje najlepsze rezultaty. Graph retrieval — nawigacja po grafie wiedzy, skuteczne dla pytań o relacje i powiązania. Agentic retrieval — AI agent dynamicznie decyduje, skąd i jak pobierać informacje.
Optymalizacja retrievalu
Jakość retrievalu zależy od wielu czynników: strategii chunkingu (jak dokumenty są dzielone), jakości embeddingów (model i fine-tuning), indeksowania (HNSW, IVF — algorytmy przybliżonego wyszukiwania), query expansion (rozszerzanie zapytania o synonimy i kontekst), rerankingu (ponowne sortowanie wyników) oraz filtrów metadanych (zawężanie po dacie, autorze, kategorii). Ewaluacja retrievalu wymaga metryk: recall@K, precision@K, MRR, NDCG — mierzących trafność na różnych poziomach rankingu.