Takaisin sanastoon Teknologia

Embedding (vektoriesitys)

Tekstin, kuvien tai äänen esittäminen lukuvektoreina — semanttisen haun ja RAG-järjestelmien perusta.

Mitä on embedding?

Embedding on tekstin (tai kuvan, äänen) esitys vektorina — listana satoja tai tuhansia liukulukuja. Embedding-malli muuntaa lauseen pisteeksi moniulotteisessa avaruudessa, jossa semanttisesti samankaltaisilla teksteillä on läheiset koordinaatit.

Miten se toimii?

Lauseet "tekoäly liiketoiminnassa" ja "keinoäly yrityksille" tuottavat samankaltaiset vektorit eri sanoista huolimatta — koska niiden merkitys on samankaltainen. Embedding-mallit koulutetaan miljardeilla tekstipareilla näiden semanttisten suhteiden oppimiseksi.

Yrityssovellukset

Embeddingienit ovat perusta: semanttinen haku, RAG (tietokannan indeksointi), deduplikointi (samankaltaisten dokumenttien havaitseminen), luokittelu (tikettien, sähköpostien, palautteen ryhmittely) ja suositukset. Embeddingien laatu määrittää kaikkien jatkoprosessien laadun.

Liittyvät palvelut ja tuotteet