Co je embedding?
Embedding je reprezentace textu (nebo obrázku, zvuku) jako vektoru — seznamu stovek nebo tisíců desetinných čísel. Model embeddingů převádí větu na bod ve vícerozměrném prostoru, kde sémanticky podobné texty mají blízké souřadnice.
Jak to funguje?
Věty „AI v podnikání" a „umělá inteligence pro firmy" vytvoří podobné vektory navzdory různým slovům — protože jejich význam je podobný. Modely embeddingů jsou trénovány na miliardách textových párů, aby se naučily tyto sémantické vztahy.
Podnikové využití
Embeddingy jsou základem: sémantického vyhledávání, RAG (indexování znalostní báze), deduplikace (detekce podobných dokumentů), klasifikace (seskupování tiketů, e-mailů, zpětné vazby) a doporučení. Kvalita embeddingů určuje kvalitu všech navazujících procesů.