O que é um embedding?
Um embedding é uma representação de texto (ou imagem, áudio) como vetor — uma lista de centenas ou milhares de números de vírgula flutuante. O modelo de embedding converte uma frase num ponto no espaço multidimensional onde textos semanticamente semelhantes têm coordenadas próximas.
Como funciona?
As frases «IA nos negócios» e «inteligência artificial para empresas» produzirão vetores semelhantes apesar das palavras diferentes — porque o seu significado é semelhante. Os modelos de embedding são treinados em milhares de milhões de pares de texto para aprender estas relações semânticas.
Aplicações empresariais
Os embeddings são a base de: pesquisa semântica, RAG (indexação da base de conhecimento), deduplicação (deteção de documentos semelhantes), classificação (agrupamento de tickets, emails, feedback) e recomendações. A qualidade do embedding determina a qualidade de todos os processos a jusante.