Co je semanticke vyhladavanie?
Semanticke vyhladavanie transformuje sposob ako hladame informacie. Tradicionalne fulltext vyhladavanie (BM25, TF-IDF) meria textovu zhodu – ak dokument neobsahuje presne tie istkove slova ako dotaz, nie je najdeny. Semanticke vyhladavanie rozumie vyznam: "koupit auto" najde dokumenty o "kupe vozidla" aj bez priesaku klucovych slov.
Tato schopnost je kriticka pre enterprise knowledgebasy, kde pouzivatelia pouzivaju odborny zargon alebo kladaju otazky prirodzenym jazykom.
Technicka implementacia
Zakladom je embedding model (napr. OpenAI Ada-002, Cohere Embed, E5, BAAI/bge), ktory prevadza text na numericke vektory zachytavajuce semanticky vyznam. Dokumenty a dotazy su transformovane do rovnakeho vektoroveho priestoru.
Vyhladavanie prebieha pomocou Approximate Nearest Neighbor (ANN) vyhladavania – nastroje ako FAISS, Qdrant, Weaviate a pgvector umoznuju efektivne prehladavat miliony vektorov v milisekundach.
Hybridny pristup
Hybridne vyhladavanie kombinuje semanticke s keyword vyhladavanim cez Reciprocal Rank Fusion. Tato kombinacia je casto lepsie ako kazdy z pristupov samotny: semantika zachyti "co chce pouzvatel", keyword vyhladavanie zabezpeci presnu zhodu specialnych termov, nazvy produktov alebo akronymov.