Volver al glosario Tecnología

Embedding (representación vectorial)

Representación de texto, imágenes o audio como vectores numéricos — la base de la búsqueda semántica y los sistemas RAG.

¿Qué es un embedding?

Un embedding es una representación de texto (o imagen, audio) como un vector — una lista de cientos o miles de números de punto flotante. El modelo de embedding convierte una frase en un punto en un espacio multidimensional donde los textos semánticamente similares tienen coordenadas cercanas.

¿Cómo funciona?

Las frases «IA en los negocios» e «inteligencia artificial para empresas» producirán vectores similares a pesar de las palabras diferentes — porque su significado es similar. Los modelos de embedding se entrenan con miles de millones de pares de texto para aprender estas relaciones semánticas.

Aplicaciones empresariales

Los embeddings son la base de: la búsqueda semántica, RAG (indexación de la base de conocimiento), deduplicación (detección de documentos similares), clasificación (agrupación de tickets, emails, feedback) y recomendaciones. La calidad del embedding determina la calidad de todos los procesos posteriores.