Pillar page

Multi-agent-AI-systemer

Et team af specialiserede AI-agenter i stedet for en enkelt generel chatbot. Orkestrering, flerlags LLM-routing, episodisk hukommelse, omkostningskontrol og komplet audit trail. Internt bruger vi HybridCrew-platformen til at levere ydelser til kunder.

En enkelt ChatGPT-lignende chatbot er et generelt værktøj. Den forstår sprog, genererer tekst, besvarer spørgsmål — men i det øjeblik en opgave kræver en sekvens af handlinger, adgang til virksomhedsdatabaser, hukommelse om tidligere interaktioner eller kvalitetsverifikation, viser dens begrænsninger sig.

Et multi-agent-AI-system er en anden arkitektur: et team af specialiserede agenter, hver med sin egen rolle, værktøjer, hukommelse og driftsstrategi. CEO-assistenten klassificerer e-mails. Den finansielle controller genererer rapporter. Security-revieweren scanner kode. Content writeren udarbejder marketingtekst. Alt koordineres af en orkestrator, der beslutter, hvem der får hvilken opgave.

Hvorfor multi-agent-systemer vinder

Specialisering i AI fungerer ligesom i forretningen. I stedet for én person, der „kender lidt af det hele", leverer et team af specialister bedre resultater. En agent fokuseret på én opgavetype — med optimerede prompts, den rette LLM-model, adgang til de rette værktøjer — gør arbejdet bedre og billigere end en generel model, der forsøger at gætte konteksten fra bunden.

Anden fordel: omkostningskontrol. De fleste opgaver kræver ikke den kraftigste LLM-model. Simple klassifikationer, generering af skabelonbaseret indhold, udtræk af data fra strukturerede dokumenter — alt det kan klares af lokale, gratis modeller, der kører på kundens GPU. Kun de mest komplekse beslutninger går til de stærkeste cloud-modeller. Typisk driftsomkostning: en brøkdel af, hvad ensartet brug af de kraftigste modeller ville koste.

Tredje: compliance og sikkerhed. Hver agent har least-privilege-tilladelser. Hver interaktion logges (audit trail). Personoplysninger anonymiseres, før de sendes til eksterne modeller (Anoxy-mikroservicen). Hele arkitekturen er designet i overensstemmelse med GDPR og EU AI Act fra første linje kode.

Komponenter i et enterprise-multi-agent-system

Ni elementer, der skal fungere sammen, for at et multi-agent-system kan være produktionsklart i en virksomhed.

Specialiserede agenter

Hver agent har ét ansvar: CEO-assistent, finansiel controller, security reviewer, backend-udvikler, content writer. Specialisering giver bedre resultater end en enkelt generel chatbot.

Orkestrator

Det centrale lag, der beslutter, hvilken agent der får hvilken opgave. Baseret på intent-klassifikation, agenttilgængelighed, LLM-omkostning og forretningskontekst.

Flerlags LLM-routing

Små opgaver → lokal model (Ollama, $0 omkostning). Mellemstore → billigere cloud-model. Komplekse → de kraftigste cloud-modeller. Drastisk omkostningsreduktion uden tab af kvalitet.

Episodisk hukommelse

Agenter husker, hvad de gjorde før, hvad resultaterne var, hvad der virkede. Over tid bliver de bedre til gentagne opgaver — de lærer af hver interaktion.

Semantisk hukommelse

Vektordatabase med domæneviden (Qdrant, pgvector). Agenter kan hurtigt finde lignende tidligere sager, referencedokumenter, virksomhedspolitikker.

PII-anonymisering (Anoxy)

Før indhold når eksterne LLM'er, scanner og anonymiserer den dedikerede Anoxy-mikroservice personoplysninger. GDPR-overensstemmelse uden funktionelle kompromisser.

Audit trail

Hver interaktion mellem agenter registreres: hvem, til hvem, hvad blev der spurgt om, hvilket svar blev givet, hvilke LLM'er blev brugt, hvad var omkostningen. Fuld observabilitet.

Monitoring og omkostningskontrol

Grænser pr. agent, pr. bruger, pr. organisation. Omkostnings-dashboard i realtid. Alarmer ved usædvanlige forbrugsstigninger. Routing-optimering baseret på data.

Eskalering til menneske

Lav confidence score, kritisk finansiel eller juridisk beslutning, edge case → automatisk eskalering til en menneskelig operatør med fuld kontekst.

Anvendelser i en virksomhed

Seks områder, hvor multi-agent-AI-systemer leverer målbar forretningsværdi. Hvert udrulles som en pilot på 4-8 uger.

CEO-assistent

Klassificerer og besvarer e-mails, booker møder, forbereder briefs før samtaler, opsummerer lange dokumenter, overvåger deadlines. Sparer typisk CEO'en 10-15 timers administration om ugen.

Compliance og juridisk overvågning

Løbende overvågning af lovændringer, klassifikation af påvirkning på virksomheden, alarmer ved nye forpligtelser. Generering af indledende GDPR-, EU AI Act-, ISO 27001-rapporter. Udkast til politikker og procedurer.

Softwareudvikling

Code review, generering af test, dokumentationsskrivning, refaktorering, generering af databasemigreringer. To-tre personer med agenter leverer den værdi, et team på 8-10 personer tidligere leverede.

Kundeservice

Ticket-klassifikation, automatiske svar på gentagne spørgsmål (baseret på vidensbase), eskalering til mennesker ved komplekse sager. First-response time reduceret fra timer til minutter.

Dokumentanalyse

Udtræk af data fra kontrakter, fakturaer, tilbud. Sammenligning af kommercielle vilkår. Detektion af uoverensstemmelser og risici. Generering af opsummeringer og rapporter til juridisk team.

Salg og marketing

Monitoring af sociale medier og brandomtaler, sentiment-klassifikation, generering af svar (gennemgået af mennesker før publicering), udarbejdelse af marketingindhold.

Chatbot vs. multi-agent-system

AspektEnkelt chatbot (ChatGPT/Copilot)Multi-agent-system
SpecialiseringGenerel model, „kender lidt af det hele"Specialiserede agenter pr. domæne
Adgang til virksomhedsdataBegrænset (copy-paste i chatvinduet)Indfødt (integration med CRM, ERP, databaser)
HukommelseChatsession (typisk 1-2 timer)Episodisk + semantisk hukommelse (persistent)
Omkostnings-routingÉn model til alle opgaverFlerlags (lokal → cloud → premium)
Udførelse af handlingerGenererer tekst, udfører ikke handlingerKalder API'er, skriver til databaser, sender e-mails
Audit trailIngen (eller rudimentær)Komplet — hver interaktion registreres
PII-anonymiseringAfhænger af brugerenHåndhævet, automatisk (Anoxy)
Compliance (GDPR, EU AI Act)Svær at dokumentereIndbygget i arkitekturen

Referenceplatform: HybridCrew

HybridCrew er en intern platform fra ESKOM AI, som vi bruger til at levere ydelser til kunder. Den orkestrerer dusinvis af specialiserede AI-agenter — hver med sin egen rolle (f.eks. organisationsassistent, finansiel controller, projektleder, backend-udvikler, security reviewer), polsk-sproget grænseflade, adgang til værktøjer og integrationer med forretningssystemer.

Centrale tekniske egenskaber:

  • Flerlags LLM-routing — fra gratis lokale modeller (Ollama) til de kraftigste cloud-modeller. Modelvalg er automatisk, baseret på opgavekompleksitet.
  • Brede integrationer — Gmail, Slack, Jira, Confluence, Microsoft Graph, Salesforce, Airtable og mange flere. Vi kan tilkoble enhver kunde-API.
  • Email Intelligence — automatisk klassifikation af CEO-e-mails, intent-genkendelse, generering af svar til godkendelse.
  • Anoxy — PII-anonymisering — en dedikeret mikroservice, der anonymiserer personoplysninger, før de sendes til eksterne modeller. GDPR-overensstemmelse uden kompromisser.
  • Episodisk og semantisk hukommelse — agenter lærer af erfaring og kan nå ind i domæneviden i vektordatabasen.
  • Omkostningsmonitoring — omkostnings-dashboard i realtid pr. agent, pr. bruger, pr. organisation. Grænser og alarmer ved usædvanlige stigninger.
  • EU AI Act-overensstemmelse — systemet er klassificeret som begrænset-risiko-AI med fulde transparensforpligtelser i Art. 50: AI-banner, mærkning af genereret indhold, eksportmetadata.

Ofte stillede spørgsmål

Hvad er et multi-agent-system?
Et multi-agent-AI-system er en arkitektur, hvor nogle eller flere dusin specialiserede AI-agenter arbejder sammen om at løse opgaver. Hver agent har sin egen rolle (f.eks. CEO-assistent, finansiel controller, security reviewer, backend-udvikler), sine egne værktøjer (API'er, databaseadgang, internet), hukommelse (episodisk — hvad den gjorde før, semantisk — domæneviden) og driftsstrategi. I stedet for en enkelt generel chatbot får virksomheden et AI-team med klar ansvarsfordeling.
Hvordan adskiller dette sig fra en enkelt chatbot som ChatGPT?
En enkelt chatbot klarer simple tekstopgaver godt, men i det øjeblik en opgave kræver adgang til virksomhedsdatabaser, integration med forretningssystemer (CRM, ERP, e-mail), udførelse af en sekvens af trin, hukommelse om tidligere interaktioner eller kvalitetsverifikation — er chatbotten ikke længere nok. Et multi-agent-system løser dette med specialisering (finansagenten kender bogføring, juraagenten kender GDPR), samarbejde (agenter kan konsultere hinanden) og orkestrering (en mekanisme, der beslutter, hvilken agent der får hvilken opgave).
Hvilke opgaver kan delegeres til et multi-agent-system?
I praksis: håndtering af CEO'ens kalender og indbakke, klassifikation og besvarelse af kunde-e-mails, overvågning af lovændringer, forberedelse af finansielle rapporter, code review af pull requests, generering af dokumentation, automatisering af medarbejderonboarding, håndtering af support-tickets, dokumentanalyse (kontrakter, fakturaer, tilbud), monitoring af sociale medier og brandomtaler, generering af marketingindhold. Jo mere gentageligt og proceduremæssigt — jo bedre egnet til automatisering.
Er multi-agent-systemer dyre at drive?
Det afhænger af omkostningsarkitekturen. Hvis hver agent bruger den kraftigste LLM til hver opgave, stiger månedlige omkostninger hurtigt. Derfor anvender vi flerlags LLM-routing: små opgaver går til lokale modeller (Ollama på kundens GPU — driftsomkostning tæt på nul), mellemstore opgaver går til billigere cloud-modeller, kun de mest komplekse beslutninger går til de kraftigste modeller. Takket være det betaler en typisk kunde en brøkdel af, hvad ensartet brug af de kraftigste modeller ville koste.
Hvordan kommunikerer agenter med hinanden?
To hovedveje: synkron (agent A stiller agent B et spørgsmål og venter på svar) og asynkron (agent A skubber en opgave til en kø, agent B behandler den i sit eget tempo, agent A får besked om resultatet). Den centrale orkestrerings-platform styrer routing, bevarer samtalehistorik (audit trail) og kontrollerer omkostninger (token-grænser pr. agent, pr. bruger). Al kommunikation logges — hver interaktion mellem agenter kan afspilles igen, og vejen til en bestemt beslutning kan inspiceres.
Hvad med datasikkerhed i et multi-agent-system?
Tre beskyttelseslag. For det første: PII-anonymisering (personoplysninger, kontonumre, skat-id'er, adresser) før afsendelse til eksterne LLM-modeller — vi bruger den dedikerede Anoxy-mikroservice, som scanner indhold før afsendelse. For det andet: agent-isolation — hver agent har least-privilege-tilladelser og kan ikke se data uden for sit domæne. For det tredje: mulighed for at køre på kundens infrastruktur — LLM-modeller kan køre lokalt (Ollama på GPU), uden at data forlader kundens netværk. GDPR-overensstemmelse og i tråd med EU AI Act.
Kan agenter begå fejl? Hvad så?
Ja — enhver LLM kan hallucinere, lave logiske fejl eller fejltolke kontekst. Mitigeringsstrategier: 1) resultatvalidering (f.eks. skal finansagenten returnere tal i et bestemt format, en validator kontrollerer overensstemmelse); 2) double-checking ved kritiske beslutninger (en anden agent verificerer uafhængigt den førstes resultat); 3) menneskelig eskalering (ved lav confidence score eller usædvanlige sager); 4) audit trail (hver beslutning registreret — kan rulles tilbage, analyseres, prompt forbedres). Kritiske finansielle og juridiske beslutninger er aldrig autonome — de kræver menneskelig godkendelse.
Hvordan ser en multi-agent-udrulning i en virksomhed ud?
Typisk fire faser. 1) Discovery (2-4 uger): identifikation af processer til automatisering, ROI-vurdering for hver, valg af 2-3 pilotkandidater. 2) Pilot (4-8 uger): udrulning af de første agenter for udvalgte processer, måling af effekt, finjustering. 3) Skalering (3-6 måneder): udvidelse til flere processer og afdelinger, integration med eksisterende systemer. 4) Optimering (løbende): finjustering af agenter baseret på produktionsdata, tilføjelse af nye roller, reduktion af LLM-modelomkostninger.
Vil et multi-agent-system erstatte medarbejdere?
Det erstatter specifikke opgaver, ikke mennesker. Det mest almindelige resultat: medarbejdere får tid tilbage (typisk 30-50% i administrative afdelinger), som de kan bruge på opgaver, der kræver menneskelig dømmekraft, kreativitet, relationsopbygning. Virksomheder fyrer ikke — tværtimod vokser de oftere hurtigere (flere projekter håndteret af samme team). Undtagelsen: gentagne lavværdiopgaver (f.eks. manuel kopiering af data mellem systemer) — de forsvinder, og ingen savner dem.
Hvilke teknologier driver multi-agent-systemer?
Mest almindelige frameworks: Microsoft AutoGen, CrewAI, LangGraph, Haystack Agents. LLM-modeller: Anthropic Claude, OpenAI GPT, lokal Llama og Mistral, polsk Bielik. Vektordatabaser til semantisk hukommelse: Qdrant, Weaviate, pgvector. Beskedkøer til async: Redis, RabbitMQ, Kafka. Monitoring: Prometheus + Grafana, Sentry, OpenTelemetry. Hos ESKOM AI kombinerer vi alt dette i en enkelt intern platform (HybridCrew) med fuld observabilitet, omkostningskontrol og compliance.

Første pilot på 4-8 uger

Vi vælger 2-3 forretningsprocesser med det højeste ROI-potentiale og udruller pilotagenter. Vi måler effekt, finjusterer og beslutter skalering.