Što je embedding?
Embedding je reprezentacija teksta (ili slike, zvuka) kao vektora — popisa stotina ili tisuća brojeva s pomičnim zarezom. Model za embedanje pretvara rečenicu u točku u višedimenzionalnom prostoru gdje semantički slični tekstovi imaju bliske koordinate.
Kako to funkcionira?
Rečenice "AI u poslovanju" i "umjetna inteligencija za tvrtke" proizvest će slične vektore unatoč različitim riječima — jer je njihovo značenje slično. Modeli za embedanje trenirani su na milijardama parova tekstova kako bi naučili te semantičke odnose.
Poslovne primjene
Embeddinzi su temelj: semantičkog pretraživanja, RAG-a (indeksiranje baze znanja), deduplikacije (otkrivanje sličnih dokumenata), klasifikacije (grupiranje tiketa, e-pošte, povratnih informacija) i preporuka. Kvaliteta embeddinga određuje kvalitetu svih naknadnih procesa.