Povratak na rječnik Tehnologija

Embedding (vektorska reprezentacija)

Reprezentacija teksta, slika ili zvuka kao vektora brojeva — temelj semantičkog pretraživanja i RAG sustava.

Što je embedding?

Embedding je reprezentacija teksta (ili slike, zvuka) kao vektora — popisa stotina ili tisuća brojeva s pomičnim zarezom. Model za embedanje pretvara rečenicu u točku u višedimenzionalnom prostoru gdje semantički slični tekstovi imaju bliske koordinate.

Kako to funkcionira?

Rečenice "AI u poslovanju" i "umjetna inteligencija za tvrtke" proizvest će slične vektore unatoč različitim riječima — jer je njihovo značenje slično. Modeli za embedanje trenirani su na milijardama parova tekstova kako bi naučili te semantičke odnose.

Poslovne primjene

Embeddinzi su temelj: semantičkog pretraživanja, RAG-a (indeksiranje baze znanja), deduplikacije (otkrivanje sličnih dokumenata), klasifikacije (grupiranje tiketa, e-pošte, povratnih informacija) i preporuka. Kvaliteta embeddinga određuje kvalitetu svih naknadnih procesa.

Povezane usluge i proizvodi