Čo je embedding?
Embedding je reprezentácia textu (alebo obrázku, zvuku) ako vektora — zoznamu stoviek alebo tisícov desatinných čísel. Model embeddingov prevádza vetu na bod vo viacrozmernom priestore, kde sémanticky podobné texty majú blízke súradnice.
Ako to funguje?
Vety „AI v podnikaní" a „umelá inteligencia pre firmy" vytvoria podobné vektory napriek rôznym slovám — pretože ich význam je podobný. Modely embeddingov sú trénované na miliardách textových párov, aby sa naučili tieto sémantické vzťahy.
Podnikové využitie
Embeddingy sú základom: sémantického vyhľadávania, RAG (indexovanie znalostnej bázy), deduplikácie (detekcia podobných dokumentov), klasifikácie (zoskupovanie tiketov, e-mailov, spätnej väzby) a odporúčaní. Kvalita embeddingov určuje kvalitu všetkých nadväzujúcich procesov.