Cosa sono gli Small Language Models?
Gli SLM sono modelli IA con meno parametri (1–7 miliardi) rispetto ai LLM (70–400+ miliardi). Esempi: Phi-4, Gemma 3, Llama 3.2. Nonostante le dimensioni ridotte, dopo il fine-tuning raggiungono una qualità competitiva in specializzazioni ristrette.
SLM vs LLM — quando usare quale?
SLM: compiti ripetitivi, classificazione, estrazione dati, RAG, triage di query. LLM: ragionamento complesso, generazione di testi lunghi, compiti che richiedono ampie conoscenze generali. Nel routing multi-livello, gli SLM gestiscono il 60–80 % delle query mentre i LLM si occupano del resto.
Vantaggi per l'azienda
Gli SLM funzionano sui server aziendali senza inviare dati al cloud (privacy + GDPR). La latenza è dell'ordine dei millisecondi anziché secondi. Il costo per query è vicino allo zero. Ideale per settori con requisiti rigorosi sui dati: finanza, sanità, settore pubblico.