Vissza a szójegyzékhez Technológia

Embedding (vektoros reprezentáció)

Szöveg, kép vagy hang számvektorokként való ábrázolása — a szemantikus keresés és RAG-rendszerek alapja.

Mi az embedding?

Az embedding szöveg (vagy kép, hang) vektorként — több száz vagy ezer lebegőpontos szám listájaként — történő ábrázolása. Az embedding modell egy mondatot a többdimenziós tér egy pontjává alakít, ahol a szemantikailag hasonló szövegek közeli koordinátákkal rendelkeznek.

Hogyan működik?

A „mesterséges intelligencia az üzletben" és „AI a vállalkozásoknak" mondatok hasonló vektorokat eredményeznek a különböző szavak ellenére — mert jelentésük hasonló. Az embedding modelleket milliárd szövegpáron tanítják be, hogy megtanulják ezeket a szemantikai kapcsolatokat.

Vállalati alkalmazások

Az embeddingek alapját képezik: a szemantikus keresésnek, a RAG-nak (tudásbázis-indexelés), a deduplikációnak (hasonló dokumentumok felismerése), az osztályozásnak (jegyek, e-mailek, visszajelzések csoportosítása) és az ajánlásoknak. Az embeddingek minősége határozza meg az összes ráépülő folyamat minőségét.

Kapcsolódó szolgáltatások és termékek