Pillar page
Multi-agent-system
Ett team av specialiserade AI-agenter istället för en enskild allmän chatbot. Orkestrering, flerlagers LLM-routing, episodiskt minne, kostnadskontroll och fullständig revisionsspårning. Internt använder vi HybridCrew-plattformen för att leverera tjänster till kunder.
En enskild chatbot i ChatGPT-stil är ett verktyg för allmänt bruk. Den förstår språk bra, genererar text, svarar på frågor — men i samma stund som en uppgift kräver en sekvens av åtgärder, åtkomst till företagsdatabaser, minne av tidigare interaktioner eller kvalitetsverifiering blir dess gränser synliga.
Ett multi-agent-system är en annan arkitektur: ett team av specialiserade agenter, var och en med sin egen roll, verktyg, minne och arbetsstrategi. VD-assistenten klassificerar e-post. Finanskontrollern genererar rapporter. Security reviewer skannar kod. Content writer skriver marknadsföringsutkast. Allt koordineras av en orkestrerare som beslutar vem som får vilken uppgift.
Varför multi-agent-system vinner
Specialisering inom AI fungerar på samma sätt som i affärsverksamhet. Istället för en person som „kan lite av allt" levererar ett team av specialister bättre resultat. En agent fokuserad på en uppgiftstyp — med optimerade prompts, rätt LLM-modell, åtkomst till rätt verktyg — gör jobbet bättre och billigare än en universalmodell som försöker gissa kontexten från grunden.
Den andra fördelen: kostnadskontroll. De flesta uppgifter kräver inte den kraftfullaste LLM-modellen. Enkla klassificeringar, generering av mallstyrt innehåll, extraktion av data från strukturerade dokument — allt detta kan utföras av lokala, gratis modeller som körs på kundens GPU. Endast de mest komplexa besluten går till de kraftfullaste molnmodellerna. Typisk driftskostnad: en bråkdel av vad enhetlig användning av de kraftfullaste modellerna skulle kosta.
Den tredje: compliance och säkerhet. Varje agent har minimala behörigheter (least privilege). Varje interaktion loggas (revisionsspårning). Personuppgifter anonymiseras innan de skickas till externa modeller (mikrotjänsten Anoxy). Hela arkitekturen är utformad i linje med GDPR och EU AI Act från första kodraden.
Komponenter i ett enterprise-klassat multi-agent-system
Nio element som måste fungera tillsammans för att ett multi-agent-system ska vara produktionsklart i ett företag.
Specialiserade agenter
Varje agent har ett ansvar: VD-assistent, finanskontroller, security reviewer, backend-utvecklare, content writer. Specialisering ger bättre resultat än en enskild allmän chatbot.
Orkestrerare
Det centrala lagret som beslutar vilken agent som får vilken uppgift. Bygger på intentionsklassificering, agenttillgänglighet, LLM-kostnader och affärskontext.
Flerlagers LLM-routing
Små uppgifter → lokal modell (Ollama, $0 kostnad). Medelstora → billigare molnmodell. Komplexa → de kraftfullaste molnmodellerna. Drastisk kostnadsreduktion utan kvalitetsförlust.
Episodiskt minne
Agenter kommer ihåg vad de gjort tidigare, vad resultaten var, vad som fungerade. Med tiden blir de bättre på repetitiva uppgifter — de lär sig av varje interaktion.
Semantiskt minne
Vektordatabas med domänkunskap (Qdrant, pgvector). Agenter kan snabbt hitta liknande tidigare fall, referensdokument, företagspolicyer.
PII-anonymisering (Anoxy)
Innan innehåll når externa LLM-modeller skannar och anonymiserar den dedikerade mikrotjänsten Anoxy personuppgifter. GDPR-efterlevnad utan funktionella kompromisser.
Revisionsspårning
Varje interaktion mellan agenter registreras: vem, till vem, vad som frågades, vilket svar som gavs, vilka LLM-modeller som användes, vilken kostnad. Full observability.
Övervakning och kostnadskontroll
Limiter per agent, per användare, per organisation. Kostnadsdashboard i realtid. Larm vid ovanliga användningstoppar. Routingoptimering baserad på data.
Eskalering till människa
Låg confidence score, kritiskt finansiellt eller juridiskt beslut, gränsfall → automatisk eskalering till en mänsklig operatör med fullständig kontext.
Tillämpningar i företaget
Sex områden där multi-agent-system levererar mätbart affärsvärde. Var och ett rullas ut som en 4-8 veckors pilot.
VD-assistent
Klassificerar och besvarar e-post, bokar möten, förbereder briefer inför samtal, sammanfattar långa dokument, övervakar deadlines. Sparar typiskt VD:n 10-15 timmars administration per vecka.
Compliance och juridisk övervakning
Kontinuerlig övervakning av lagändringar, klassificering av påverkan på företaget, larm vid nya skyldigheter. Generering av inledande GDPR-, EU AI Act- och ISO 27001-rapporter. Utkast till policyer och rutiner.
Mjukvaruutveckling
Kodgranskning, testgenerering, dokumentationsskrivande, refaktorering, generering av databasmigreringar. Två eller tre personer med agenter levererar samma värde som ett team på 8-10 personer.
Kundtjänst
Ärendeklassificering, automatiska svar på repetitiva frågor (baserat på kunskapsbasen), eskalering till människor vid komplexa fall. First-response time kortat från timmar till minuter.
Dokumentanalys
Extraktion av data från avtal, fakturor, offerter. Jämförelse av kommersiella villkor. Detektion av inkonsekvenser och risker. Generering av sammanfattningar och rapporter för juridikteamet.
Försäljning och marknadsföring
Övervakning av sociala medier och varumärkesnämningar, sentimentklassificering, generering av svar (granskade av människor före publicering), utkast till marknadsföringsinnehåll.
Chatbot vs. multi-agent-system
| Aspekt | Enskild chatbot (ChatGPT/Copilot) | Multi-agent-system |
|---|---|---|
| Specialisering | Allmän modell, „kan lite av allt" | Specialiserade agenter per domän |
| Åtkomst till företagsdata | Begränsad (klistra in i chatfönstret) | Native (integration med CRM, ERP, databaser) |
| Minne | Chatsession (typiskt 1-2 timmar) | Episodiskt + semantiskt minne (varaktigt) |
| Kostnadsrouting | En modell för alla uppgifter | Flerlagers (lokal → moln → premium) |
| Åtgärdsutförande | Genererar text, utför inga åtgärder | Anropar API:er, skriver till databaser, skickar e-post |
| Revisionsspårning | Ingen (eller rudimentär) | Komplett — varje interaktion registrerad |
| PII-anonymisering | Beror på användaren | Påtvingad, automatisk (Anoxy) |
| Compliance (GDPR, EU AI Act) | Svår att bevisa | Inbyggd i arkitekturen |
Referensplattform: HybridCrew
HybridCrew är en intern plattform från ESKOM AI som vi använder för att leverera tjänster till kunder. Den orkestrerar dussintals specialiserade AI-agenter — var och en med sin egen roll (t.ex. organisationsassistent, finanskontroller, projektledare, backend-utvecklare, security reviewer), ett polskspråkigt gränssnitt, åtkomst till verktyg och integrationer med affärssystem.
Nyckelfunktioner i tekniken:
- Flerlagers LLM-routing — från gratis lokala modeller (Ollama) till de kraftfullaste molnmodellerna. Modellval automatiskt, baserat på uppgiftens komplexitet.
- Breda integrationer — Gmail, Slack, Jira, Confluence, Microsoft Graph, Salesforce, Airtable och många fler. Vi kan koppla in vilket kund-API som helst.
- Email Intelligence — automatisk klassificering av VD:ns e-post, intentigenkänning, generering av svar för godkännande.
- Anoxy — PII-anonymisering — en dedikerad mikrotjänst som anonymiserar personuppgifter innan de skickas till externa modeller. GDPR-efterlevnad utan kompromisser.
- Episodiskt och semantiskt minne — agenter lär sig av erfarenhet och kan nå domänkunskap i vektordatabasen.
- Kostnadsövervakning — kostnadsdashboard i realtid per agent, per användare, per organisation. Limiter och larm vid ovanliga toppar.
- EU AI Act-efterlevnad — systemet är klassificerat som AI med begränsad risk, med fullständiga transparensskyldigheter (Art. 50): en AI-banner, märkning av genererat innehåll, exportmetadata.
Vanliga frågor
Vad är ett multi-agent-system?
Hur skiljer sig detta från en enskild chatbot som ChatGPT?
Vilka uppgifter kan delegeras till ett multi-agent-system?
Är multi-agent-system dyra att driva?
Hur kommunicerar agenter med varandra?
Hur är det med datasäkerheten i ett multi-agent-system?
Kan agenter göra misstag? Vad händer då?
Hur ser en utrullning av ett multi-agent-system i ett företag ut?
Kommer ett multi-agent-system att ersätta anställda?
Vilka teknologier driver multi-agent-system?
Första piloten på 4-8 veckor
Vi väljer 2-3 affärsprocesser med högst ROI-potential och rullar ut pilotagenter. Vi mäter effekten, finjusterar och beslutar om skalning.