Zurück zum Glossar Technologie

Embedding (Vektorrepräsentation)

Darstellung von Text, Bildern oder Audio als Zahlenvektoren — die Grundlage semantischer Suche und RAG-Systeme.

Was ist ein Embedding?

Ein Embedding ist die Darstellung von Text (oder Bild, Audio) als Vektor — eine Liste von Hunderten oder Tausenden von Gleitkommazahlen. Das Embedding-Modell wandelt einen Satz in einen Punkt im mehrdimensionalen Raum um, in dem semantisch ähnliche Texte nahe Koordinaten haben.

Wie funktioniert es?

Die Sätze „KI im Geschäft“ und „Künstliche Intelligenz für Unternehmen“ erzeugen trotz unterschiedlicher Wörter ähnliche Vektoren — weil ihre Bedeutung ähnlich ist. Embedding-Modelle werden auf Milliarden von Textpaaren trainiert, um diese semantischen Beziehungen zu erlernen.

Unternehmensanwendungen

Embeddings sind die Grundlage von: semantischer Suche, RAG (Indexierung der Wissensdatenbank), Deduplizierung (Erkennung ähnlicher Dokumente), Klassifizierung (Gruppierung von Tickets, E-Mails, Feedback) und Empfehlungen. Die Embedding-Qualität bestimmt die Qualität aller nachgelagerten Prozesse.

Verwandte Dienstleistungen und Produkte