Volver ao glosario Tecnoloxía

Embedding (Representación Vectorial)

Representación de texto, imaxes ou audio como vectores de números — o fundamento da busca semántica e os sistemas RAG.

Que é un Embedding?

Un embedding é unha representación de texto (ou imaxe, audio) como vector — unha lista de centos ou miles de números de punto flotante. O modelo de embedding converte unha frase nun punto no espazo multidimensional onde textos semanticamente similares teñen coordenadas próximas.

Como funciona?

As frases «IA nos negocios» e «intelixencia artificial para empresas» producirán vectores similares a pesar das palabras diferentes — porque o seu significado é similar. Os modelos de embedding adéstranse con miles de millóns de pares de textos para aprender estas relacións semánticas.

Aplicacións empresariais

Os embeddings son o fundamento de: busca semántica, RAG (indexación de bases de coñecemento), deduplicación (detección de documentos similares), clasificación (agrupación de tíckets, correos electrónicos, retroalimentación) e recomendacións. A calidade do embedding determina a calidade de todos os procesos posteriores.