Nazaj na slovar Tehnologija

Embedding (vektorska reprezentacija)

Predstavitev besedila, slik ali zvoka kot vektorjev števil — temelj semantičnega iskanja in sistemov RAG.

Kaj je embedding?

Embedding je predstavitev besedila (ali slike, zvoka) kot vektorja — seznama stotih ali tisočev števil s plavajočo vejico. Model za embedanje pretvori stavek v točko v večdimenzionalnem prostoru, kjer imajo semantično podobna besedila bližnje koordinate.

Kako to deluje?

Stavka "UI v poslovanju" in "umetna inteligenca za podjetja" bosta ustvarila podobna vektorja kljub različnim besedam — ker je njun pomen podoben. Modeli za embedanje so naučeni na milijardah parov besedil, da se naučijo teh semantičnih razmerij.

Poslovne uporabe

Embeddingi so temelj: semantičnega iskanja, RAG-a (indeksiranje baze znanja), deduplikacije (odkrivanje podobnih dokumentov), klasifikacije (združevanje zahtevkov, e-pošte, povratnih informacij) in priporočil. Kakovost embeddingov določa kakovost vseh nadaljnjih procesov.

Povezane storitve in izdelki