Que sont les Small Language Models ?
Les SLM sont des modèles IA avec moins de paramètres (1 à 7 milliards) par rapport aux LLM (70 à 400+ milliards). Exemples : Phi-4, Gemma 3, Llama 3.2. Malgré leur taille réduite, après fine-tuning, ils atteignent une qualité compétitive dans des spécialisations étroites.
SLM vs LLM — quand utiliser lequel ?
SLM : tâches répétitives, classification, extraction de données, RAG, triage de requêtes. LLM : raisonnement complexe, génération de textes longs, tâches nécessitant de larges connaissances générales. Dans le routage multi-niveaux, les SLM traitent 60 à 80 % des requêtes tandis que les LLM gèrent le reste.
Avantages pour l'entreprise
Les SLM fonctionnent sur les serveurs de l'entreprise sans envoyer de données dans le cloud (confidentialité + RGPD). La latence est de l'ordre de la milliseconde au lieu de secondes. Le coût par requête est proche de zéro. Idéal pour les secteurs avec des exigences strictes en matière de données : finance, santé, secteur public.