O que são Small Language Models?
Os SLM são modelos de IA com menos parâmetros (1 a 7 mil milhões) em comparação com os LLM (70 a 400+ mil milhões). Exemplos: Phi-4, Gemma 3, Llama 3.2. Apesar do seu menor tamanho, após fine-tuning, alcançam qualidade competitiva em especializações específicas.
SLM vs LLM — quando usar qual?
SLM: tarefas repetitivas, classificação, extração de dados, RAG, triagem de consultas. LLM: raciocínio complexo, geração de textos longos, tarefas que exigem amplo conhecimento geral. No encaminhamento multinível, os SLM processam 60 a 80 % das consultas enquanto os LLM tratam do resto.
Vantagens para a empresa
Os SLM funcionam em servidores empresariais sem enviar dados para a cloud (privacidade + RGPD). A latência é da ordem dos milissegundos em vez de segundos. O custo por consulta é próximo de zero. Ideal para setores com requisitos rigorosos de dados: finanças, saúde, setor público.