Retour au glossaire Technologie

SLM (Small Language Models)

Modèles IA compacts (1–7 Md de paramètres) fonctionnant localement, rapidement et à moindre coût — idéaux pour les tâches spécialisées sans frais cloud.

Que sont les Small Language Models ?

Les SLM sont des modèles IA avec moins de paramètres (1 à 7 milliards) par rapport aux LLM (70 à 400+ milliards). Exemples : Phi-4, Gemma 3, Llama 3.2. Malgré leur taille réduite, après fine-tuning, ils atteignent une qualité compétitive dans des spécialisations étroites.

SLM vs LLM — quand utiliser lequel ?

SLM : tâches répétitives, classification, extraction de données, RAG, triage de requêtes. LLM : raisonnement complexe, génération de textes longs, tâches nécessitant de larges connaissances générales. Dans le routage multi-niveaux, les SLM traitent 60 à 80 % des requêtes tandis que les LLM gèrent le reste.

Avantages pour l'entreprise

Les SLM fonctionnent sur les serveurs de l'entreprise sans envoyer de données dans le cloud (confidentialité + RGPD). La latence est de l'ordre de la milliseconde au lieu de secondes. Le coût par requête est proche de zéro. Idéal pour les secteurs avec des exigences strictes en matière de données : finance, santé, secteur public.

Services et produits associés