Czym są małe modele językowe?
SLM (Small Language Models) to modele AI o mniejszej liczbie parametrów (1-7 mld) niż duże modele językowe (LLM, 70-400+ mld). Przykłady: Phi-4, Gemma 3, Llama 3.2. Mimo mniejszego rozmiaru, po fine-tuningu osiągają konkurencyjną jakość w wąskich specjalizacjach.
SLM vs LLM — kiedy co stosować?
SLM: powtarzalne zadania, klasyfikacja, ekstrakcja danych, RAG, triage zapytań. LLM: złożone rozumowanie, generacja długich tekstów, zadania wymagające szerokiej wiedzy ogólnej. W routingu wielopoziomowym SLM obsługują 60-80% zapytań, a LLM zajmują się resztą.
Zalety dla enterprise
SLM działają na serwerach firmowych bez wysyłania danych do chmury (prywatność + RODO). Latencja to milisekundy zamiast sekund. Koszt per zapytanie bliski zeru. Idealne dla branż z rygorystycznymi wymogami dotyczącymi danych: finanse, medycyna, sektor publiczny.