Voltar ao glossário Tecnologia

Embedding (representação vetorial)

Representação de texto, imagens ou áudio como vetores numéricos — a base da pesquisa semântica e dos sistemas RAG.

O que é um embedding?

Um embedding é uma representação de texto (ou imagem, áudio) como vetor — uma lista de centenas ou milhares de números de vírgula flutuante. O modelo de embedding converte uma frase num ponto no espaço multidimensional onde textos semanticamente semelhantes têm coordenadas próximas.

Como funciona?

As frases «IA nos negócios» e «inteligência artificial para empresas» produzirão vetores semelhantes apesar das palavras diferentes — porque o seu significado é semelhante. Os modelos de embedding são treinados em milhares de milhões de pares de texto para aprender estas relações semânticas.

Aplicações empresariais

Os embeddings são a base de: pesquisa semântica, RAG (indexação da base de conhecimento), deduplicação (deteção de documentos semelhantes), classificação (agrupamento de tickets, emails, feedback) e recomendações. A qualidade do embedding determina a qualidade de todos os processos a jusante.

Serviços e produtos relacionados