Pillar page

Multi-agent AI-systemen

Een team van gespecialiseerde AI-agenten in plaats van één algemene chatbot. Orkestratie, meerlaagse LLM-routing, episodisch geheugen, kostenbeheersing en een volledige audit trail. Intern gebruiken we het HybridCrew-platform om diensten aan klanten te leveren.

Een enkele chatbot in ChatGPT-stijl is een tool voor algemeen gebruik. Hij begrijpt taal uitstekend, genereert teksten, beantwoordt vragen — maar zodra een taak een reeks acties vereist, toegang tot bedrijfsdatabases, geheugen van eerdere interacties of kwaliteitsverificatie, worden zijn beperkingen zichtbaar.

Een multi-agent AI-systeem is een andere architectuur: een team van gespecialiseerde agenten, elk met een eigen rol, tools, geheugen en werkstrategie. De CEO-assistent classificeert e-mail. De financial controller genereert rapporten. De security reviewer scant code. De content writer schrijft marketingdrafts. Alles gecoördineerd door een orchestrator die beslist wie welke taak krijgt.

Waarom multi-agent systemen winnen

Specialisatie werkt in AI hetzelfde als in de business. In plaats van één persoon die „van alles een beetje kan", behaalt een team van specialisten betere resultaten. Een agent gericht op één type taken — met geoptimaliseerde prompts, het juiste LLM-model, toegang tot de juiste tools — voert het werk beter en goedkoper uit dan een generalistisch model dat de context vanaf nul probeert te raden.

Tweede voordeel: kostenbeheersing. De meeste taken vereisen niet het krachtigste LLM-model. Eenvoudige classificaties, het genereren van templated content, het extraheren van gegevens uit gestructureerde documenten — dat alles kan door lokale, gratis modellen op de GPU van de klant worden gedaan. Alleen de meest complexe beslissingen gaan naar de sterkste cloudmodellen. Typische operationele kosten: een fractie van wat uniform gebruik van de krachtigste modellen zou kosten.

Derde: compliance en security. Elke agent heeft minimale rechten (least privilege). Elke interactie wordt gelogd (audit trail). Persoonsgegevens worden geanonimiseerd voordat ze naar externe modellen worden verzonden (Anoxy-microservice). De hele architectuur is vanaf de eerste regel code ontworpen in lijn met AVG en EU AI Act.

Componenten van een enterprise-grade multi-agent systeem

Negen elementen die samen moeten werken om een multi-agent systeem productieklaar te maken binnen een bedrijf.

Gespecialiseerde agenten

Elke agent heeft één verantwoordelijkheid: CEO-assistent, financial controller, security reviewer, backend developer, content writer. Specialisatie levert betere resultaten dan één algemene chatbot.

Orchestrator

De centrale laag die beslist welke agent welke taak krijgt. Gebaseerd op intentieclassificatie, agentbeschikbaarheid, LLM-modelkosten en bedrijfscontext.

Meerlaagse LLM-routing

Kleine taken → lokaal model (Ollama, $0 kosten). Middelgroot → goedkoper cloudmodel. Complex → krachtigste cloudmodellen. Drastische kostenreductie zonder kwaliteitsverlies.

Episodisch geheugen

Agenten onthouden wat ze eerder deden, wat de resultaten waren, wat werkte. Na verloop van tijd worden ze beter in repetitieve taken — ze leren van elke interactie.

Semantisch geheugen

Vector database van domeinkennis (Qdrant, pgvector). Agenten kunnen snel vergelijkbare gevallen uit het verleden vinden, referentiedocumenten, bedrijfsbeleid.

PII-anonimisering (Anoxy)

Voordat content externe LLM's bereikt, scant en anonimiseert de toegewijde Anoxy-microservice persoonsgegevens. AVG-compliance zonder functionele concessies.

Audit trail

Elke interactie tussen agenten wordt vastgelegd: wie, aan wie, wat is gevraagd, welk antwoord is gegeven, welke LLM's zijn gebruikt, wat de kosten waren. Volledige observability.

Monitoring en kostenbeheersing

Limieten per agent, per gebruiker, per organisatie. Realtime kostendashboard. Alerts bij ongebruikelijke verbruiksstijgingen. Routing-optimalisatie op basis van data.

Escalatie naar mens

Lage confidence-score, kritieke financiële of juridische beslissing, edge case → automatische escalatie naar een menselijke operator met volledige context.

Toepassingen binnen een bedrijf

Zes gebieden waar multi-agent AI-systemen meetbare zakelijke waarde leveren. Elk wordt uitgerold als een pilot van 4-8 weken.

CEO-assistent

Classificeert en beantwoordt e-mails, plant vergaderingen, bereidt briefings voor gesprekken voor, vat lange documenten samen, monitort deadlines. Bespaart de CEO doorgaans 10-15 uur administratie per week.

Compliance en juridische monitoring

Continue monitoring van juridische wijzigingen, classificatie van impact op het bedrijf, alerts bij nieuwe verplichtingen. Genereren van initiële AVG-, EU AI Act-, ISO 27001-rapporten. Drafts van beleid en procedures.

Softwareontwikkeling

Code review, testgeneratie, documentatie schrijven, refactoring, databasemigraties genereren. Twee of drie mensen met agenten leveren de waarde van een team van 8-10 personen.

Klantenservice

Ticketclassificatie, automatische antwoorden op herhaalbare vragen (op basis van de kennisbank), escalatie naar mensen voor complexe zaken. First-response tijd teruggebracht van uren naar minuten.

Documentanalyse

Extractie van gegevens uit contracten, facturen, offertes. Vergelijken van commerciële voorwaarden. Detectie van inconsistenties en risico's. Genereren van samenvattingen en rapporten voor het juridisch team.

Sales en marketing

Monitoring van social media en merkvermeldingen, sentimentclassificatie, genereren van reacties (door mensen gecontroleerd voor publicatie), drafts van marketingcontent.

Chatbot vs. multi-agent systeem

AspectEnkele chatbot (ChatGPT/Copilot)Multi-agent systeem
SpecialisatieAlgemeen model, „kan van alles een beetje"Gespecialiseerde agenten per domein
Toegang tot bedrijfsdataBeperkt (copy-paste in chatvenster)Native (integratie met CRM, ERP, databases)
GeheugenChatsessie (doorgaans 1-2 uur)Episodisch + semantisch geheugen (persistent)
KostenroutingEén model voor alle takenMeerlaags (lokaal → cloud → premium)
Acties uitvoerenGenereert tekst, voert geen acties uitRoept API's aan, schrijft naar databases, verstuurt e-mails
Audit trailGeen (of rudimentair)Volledig — elke interactie vastgelegd
PII-anonimiseringAfhankelijk van de gebruikerAfgedwongen, automatisch (Anoxy)
Compliance (AVG, EU AI Act)Moeilijk aan te tonenIngebouwd in de architectuur

Referentieplatform: HybridCrew

HybridCrew is een intern platform van ESKOM AI dat we gebruiken om diensten aan klanten te leveren. Het orkestreert tientallen gespecialiseerde AI-agenten — elk met een eigen rol (bijv. organisatie-assistent, financial controller, project manager, backend developer, security reviewer), een Pools-talige interface, toegang tot tools en integraties met bedrijfssystemen.

Belangrijke technische kenmerken:

  • Meerlaagse LLM-routing — van gratis lokale modellen (Ollama) tot de krachtigste cloudmodellen. Modelkeuze automatisch, op basis van taakcomplexiteit.
  • Brede integraties — Gmail, Slack, Jira, Confluence, Microsoft Graph, Salesforce, Airtable en vele andere. We kunnen elke klant-API aansluiten.
  • Email Intelligence — automatische classificatie van CEO-post, intentieherkenning, antwoorden genereren ter goedkeuring.
  • Anoxy — PII-anonimisering — een toegewijde microservice die persoonsgegevens anonimiseert voordat ze naar externe modellen worden verzonden. AVG-compliance zonder concessies.
  • Episodisch en semantisch geheugen — agenten leren van ervaringen, kunnen domeinkennis raadplegen in de vector database.
  • Kostenmonitoring — realtime kostendashboard per agent, per gebruiker, per organisatie. Limieten en alerts bij ongebruikelijke stijgingen.
  • EU AI Act-compliance — systeem geclassificeerd als beperkt-risico AI, met de volledige transparantieverplichtingen van Art. 50: een banner die over AI informeert, markering van gegenereerde content, exportmetadata.

Veelgestelde vragen

Wat is een multi-agent systeem?
Een multi-agent AI-systeem is een architectuur waarin een aantal of enkele tientallen gespecialiseerde AI-agenten samenwerken om taken op te lossen. Elke agent heeft zijn eigen rol (bijv. CEO-assistent, financial controller, security reviewer, backend developer), eigen tools (API's, databasetoegang, internet), geheugen (episodisch — wat hij eerder deed, semantisch — domeinkennis) en werkstrategie. In plaats van één algemene chatbot krijgt het bedrijf een AI-team met een duidelijke verantwoordelijkheidsverdeling.
Hoe verschilt dit van een enkele chatbot zoals ChatGPT?
Een enkele chatbot kan goed omgaan met eenvoudige teksttaken, maar zodra een taak vereist: toegang tot bedrijfsdatabases, integratie met bedrijfssystemen (CRM, ERP, e-mail), het uitvoeren van een reeks stappen, geheugen van eerdere interacties, kwaliteitsverificatie — schiet de chatbot tekort. Een multi-agent systeem lost dit op door specialisatie (de finance-agent kent boekhouding, de juridische agent kent AVG), samenwerking (agenten kunnen elkaar raadplegen) en orkestratie (een mechanisme dat beslist welke agent welke taak krijgt).
Welke taken kunnen aan een multi-agent systeem worden gedelegeerd?
In de praktijk: beheer van CEO-kalender en -inbox, classificatie en beantwoording van klant-e-mails, monitoring van juridische wijzigingen, voorbereiding van financiële rapporten, code review van pull requests, generatie van documentatie, automatisering van medewerkers-onboarding, afhandeling van supporttickets, documentanalyse (contracten, facturen, offertes), monitoring van social media en merkvermeldingen, generatie van marketingcontent. Hoe repetitiever en procedureler — hoe geschikter voor automatisering.
Zijn multi-agent systemen duur in onderhoud?
Het hangt af van de kostenarchitectuur. Als elke agent voor elke taak het krachtigste LLM-model gebruikt, lopen de maandelijkse kosten snel op. Daarom passen we meerlaagse LLM-modelrouting toe: kleine taken gaan naar lokale modellen (Ollama op een GPU in de infrastructuur van de klant — operationele kosten dichtbij nul), middelgrote taken naar goedkopere cloudmodellen, alleen de meest complexe beslissingen naar de krachtigste modellen. Hierdoor betaalt een typische klant een fractie van wat uniform gebruik van de krachtigste modellen zou kosten.
Hoe communiceren agenten met elkaar?
Twee hoofdpaden: synchroon (agent A stelt een vraag aan agent B en wacht op het antwoord) en asynchroon (agent A duwt een taak in een queue, agent B verwerkt in zijn eigen tempo, agent A krijgt een notificatie van het resultaat). Het centrale orkestratieplatform beheert routing, bewaart conversatiehistorie (audit trail), controleert kosten (tokenlimieten per agent, per gebruiker). Alle communicatie wordt gelogd — elke interactie tussen agenten kan worden afgespeeld en het pad naar een specifieke beslissing kan worden geïnspecteerd.
Hoe zit het met datasecurity in een multi-agent systeem?
Drie beschermingslagen. Ten eerste: PII-anonimisering (persoonsgegevens, rekeningnummers, fiscale ID's, adressen) vóór verzending naar externe LLM-modellen — daarvoor gebruiken we de toegewijde Anoxy-microservice die content scant voordat deze de omgeving verlaat. Ten tweede: agent-isolatie — elke agent heeft least-privilege rechten en kan geen data buiten zijn domein zien. Ten derde: optie om op de infrastructuur van de klant te draaien — LLM-modellen kunnen lokaal draaien (Ollama op GPU), zonder dat data het netwerk van de klant verlaat. AVG-conform en afgestemd op EU AI Act-richtlijnen.
Kunnen agenten fouten maken? Wat dan?
Ja, elk LLM kan hallucineren, logische fouten maken of context verkeerd interpreteren. Mitigatiestrategieën: 1) resultaatvalidatie (bijv. de finance-agent moet getallen in een specifiek formaat retourneren, een validator controleert de naleving); 2) double-checking voor kritieke beslissingen (een tweede agent verifieert onafhankelijk het resultaat van de eerste); 3) escalatie naar mens (bij lage confidence-score of ongebruikelijke gevallen); 4) audit trail (elke beslissing vastgelegd — kan worden teruggedraaid, geanalyseerd, prompt verbeterd). Kritieke financiële en juridische beslissingen zijn nooit autonoom — vereisen menselijke goedkeuring.
Hoe ziet de uitrol van een multi-agent systeem in een bedrijf eruit?
Typisch vier fasen. 1) Discovery (2-4 weken): identificatie van processen voor automatisering, ROI-beoordeling van elk, kiezen van 2-3 pilotkandidaten. 2) Pilot (4-8 weken): uitrol van de eerste agenten voor geselecteerde processen, impactmeting, fine-tuning. 3) Schaling (3-6 maanden): uitbreiding naar meer processen en afdelingen, integratie met bestaande systemen. 4) Optimalisatie (continu): verfijning van agenten op basis van productiedata, toevoegen van nieuwe rollen, verlagen van LLM-modelkosten.
Zal een multi-agent systeem medewerkers vervangen?
Het vervangt specifieke taken, niet mensen. Het meest voorkomende resultaat: medewerkers winnen tijd terug (doorgaans 30-50% in administratieve afdelingen), die ze kunnen besteden aan taken die menselijk oordeel, creativiteit, relatieopbouw vereisen. Bedrijven ontslaan niet — integendeel, ze groeien vaker sneller (meer projecten verwerkt door hetzelfde team). De uitzondering: repetitieve, laagwaardige taken (bijv. handmatig gegevens tussen systemen kopiëren) — die verdwijnen, en niemand mist ze.
Welke technologieën zitten er achter multi-agent systemen?
Meest gebruikelijke frameworks: Microsoft AutoGen, CrewAI, LangGraph, Haystack Agents. LLM-modellen: Anthropic Claude, OpenAI GPT, lokale Llama en Mistral, Poolse Bielik. Vector databases voor semantisch geheugen: Qdrant, Weaviate, pgvector. Message queues voor async: Redis, RabbitMQ, Kafka. Monitoring: Prometheus + Grafana, Sentry, OpenTelemetry. Bij ESKOM AI combineren we dit alles in één intern platform (HybridCrew) met volledige observability, kostenbeheersing en compliance.

Eerste pilot in 4-8 weken

We kiezen 2-3 bedrijfsprocessen met het grootste ROI-potentieel en rollen pilot-agenten uit. We meten impact, finetunen en beslissen over schaling.