Wróć do słownika Technologia

Embedding (osadzanie wektorowe)

Reprezentacja tekstu, obrazu lub dźwięku jako wektora liczb — fundament wyszukiwania semantycznego i systemów RAG.

Czym jest embedding?

Embedding to reprezentacja tekstu (lub obrazu, dźwięku) jako wektora — listy setek lub tysięcy liczb zmiennoprzecinkowych. Model embedding zamienia zdanie w punkt w wielowymiarowej przestrzeni, gdzie semantycznie podobne teksty mają bliskie współrzędne.

Jak to działa?

Zdanie "Sztuczna inteligencja w biznesie" i "AI dla firm" dadzą zbliżone wektory, mimo różnych słów — bo ich znaczenie jest podobne. Model embedding (np. text-embedding-3, BGE, E5) jest trenowany na miliardach par tekstu, by nauczyć się tych relacji semantycznych.

Zastosowania enterprise

Embeddingi to fundament: wyszukiwanie semantyczne (szukaj znaczenia, nie słów kluczowych), RAG (indeksowanie bazy wiedzy), deduplikacja (wykrywanie podobnych dokumentów/zgłoszeń), klasyfikacja (grupowanie ticketów, emaili, feedbacku), rekomendacje ("podobne produkty/artykuły"). Jakość embeddingów determinuje jakość wszystkich dalszych procesów.

Powiązane usługi i produkty