Hvad er en embedding?
En embedding er en repræsentation af tekst (eller billede, lyd) som en vektor — en liste med hundredvis eller tusindvis af decimaltal. Embeddingmodellen konverterer en sætning til et punkt i det multidimensionale rum, hvor semantisk lignende tekster har nære koordinater.
Hvordan fungerer det?
Sætningerne "AI i erhvervslivet" og "kunstig intelligens for virksomheder" producerer lignende vektorer trods forskellige ord — fordi deres betydning er lignende. Embeddingmodeller trænes på milliarder af tekstpar for at lære disse semantiske relationer.
Virksomhedsanvendelser
Embeddings er grundlaget for: semantisk søgning, RAG (vidensbaseindeksering), deduplikering (detektion af lignende dokumenter), klassificering (gruppering af sager, e-mails, feedback) og anbefalinger. Embeddingkvaliteten bestemmer kvaliteten af alle efterfølgende processer.