Mitä on embedding?
Embedding on tekstin (tai kuvan, äänen) esitys vektorina — listana satoja tai tuhansia liukulukuja. Embedding-malli muuntaa lauseen pisteeksi moniulotteisessa avaruudessa, jossa semanttisesti samankaltaisilla teksteillä on läheiset koordinaatit.
Miten se toimii?
Lauseet "tekoäly liiketoiminnassa" ja "keinoäly yrityksille" tuottavat samankaltaiset vektorit eri sanoista huolimatta — koska niiden merkitys on samankaltainen. Embedding-mallit koulutetaan miljardeilla tekstipareilla näiden semanttisten suhteiden oppimiseksi.
Yrityssovellukset
Embeddingienit ovat perusta: semanttinen haku, RAG (tietokannan indeksointi), deduplikointi (samankaltaisten dokumenttien havaitseminen), luokittelu (tikettien, sähköpostien, palautteen ryhmittely) ja suositukset. Embeddingien laatu määrittää kaikkien jatkoprosessien laadun.