Pillar-sivu

Tekoälyn moniagenttijärjestelmät

Erikoistuneiden tekoälyagenttien tiimi yksittäisen yleisen chatbotin sijaan. Orkestrointi, monitasoinen LLM-reititys, episodimuisti, kustannusten hallinta ja täydellinen audit-jälki. Sisäisesti käytämme HybridCrew-alustaa palveluiden toimittamiseen asiakkaille.

Yksittäinen ChatGPT-tyylinen chatbot on yleiskäyttöinen työkalu. Se ymmärtää kieltä, generoi tekstiä, vastaa kysymyksiin — mutta sillä hetkellä, kun tehtävä vaatii toimintojen sarjaa, pääsyä yrityksen tietokantoihin, muistia aiemmista vuorovaikutuksista tai laadun varmistusta, sen rajat näkyvät.

Moniagenttinen tekoälyjärjestelmä on erilainen arkkitehtuuri: erikoistuneiden agenttien tiimi, joista jokaisella on oma roolinsa, työkalunsa, muistinsa ja toimintastrategiansa. Toimitusjohtajan assistentti luokittelee sähköpostia. Talouden controller generoi raportteja. Security reviewer skannaa koodia. Content writer kirjoittaa markkinointidrafteja. Kaiken koordinoi orkestroija, joka päättää, kuka saa minkäkin tehtävän.

Miksi moniagenttijärjestelmät voittavat

Erikoistuminen tekoälyssä toimii samoin kuin liiketoiminnassa. Yhden „kaikkea vähän osaavan" henkilön sijaan asiantuntijatiimi tuottaa parempia tuloksia. Yhteen tehtävätyyppiin keskittynyt agentti — optimoiduilla prompteilla, oikealla LLM-mallilla, pääsyllä oikeisiin työkaluihin — tekee työn paremmin ja halvemmalla kuin yleismalli, joka yrittää arvata kontekstin nollasta.

Toinen etu: kustannusten hallinta. Useimmat tehtävät eivät vaadi vahvinta LLM-mallia. Pienet luokittelut, mallipohjaisen sisällön generointi, datan poiminta strukturoiduista dokumenteista — kaiken tämän voi tehdä paikallisilla, ilmaisilla malleilla asiakkaan GPU:lla. Vain monimutkaisimmat päätökset päätyvät vahvimpiin pilvimalleihin. Tyypilliset operatiiviset kustannukset: murto-osa siitä, mitä vahvimpien mallien yhtenäinen käyttö maksaisi.

Kolmas: compliance ja turvallisuus. Jokaisella agentilla on vähimmäisoikeudet (least privilege). Jokainen vuorovaikutus tallentuu (audit-jälki). Henkilötiedot anonymisoidaan ennen lähettämistä ulkoisiin malleihin (Anoxy-mikropalvelu). Koko arkkitehtuuri on suunniteltu GDPR:n ja EU AI Actin mukaisesti koodin ensimmäisestä rivistä alkaen.

Enterprise-tason moniagenttijärjestelmän komponentit

Yhdeksän elementtiä, joiden on toimittava yhdessä, jotta moniagenttijärjestelmä olisi tuotantokelpoinen yrityksen sisällä.

Erikoistuneet agentit

Jokaisella agentilla on yksi vastuu: toimitusjohtajan assistentti, talouden controller, security reviewer, backend-kehittäjä, content writer. Erikoistuminen tuottaa parempia tuloksia kuin yksittäinen yleinen chatbot.

Orkestroija

Keskeinen kerros, joka päättää, mikä agentti saa minkäkin tehtävän. Perustuu aikomusten luokitteluun, agenttien saatavuuteen, LLM-kustannuksiin ja liiketoimintakontekstiin.

Monitasoinen LLM-reititys

Pienet tehtävät → paikallinen malli (Ollama, 0 € kustannus). Keskitasoiset → halvempi pilvimalli. Monimutkaiset → vahvimmat pilvimallit. Drastinen kustannusten alennus ilman laadun menetystä.

Episodimuisti

Agentit muistavat, mitä ovat tehneet aiemmin, mitkä olivat tulokset, mikä toimi. Ajan myötä ne paranevat toistuvissa tehtävissä — oppivat jokaisesta vuorovaikutuksesta.

Semanttinen muisti

Domain-tiedon vektoritietokanta (Qdrant, pgvector). Agentit voivat nopeasti löytää samankaltaisia aiempia tapauksia, viiteasiakirjoja, yrityksen käytäntöjä.

PII-anonymisointi (Anoxy)

Ennen sisällön lähettämistä ulkoisiin LLM-malleihin omistettu Anoxy-mikropalvelu skannaa ja anonymisoi henkilötiedot. GDPR-yhteensopivuus ilman toiminnallisia kompromisseja.

Audit-jälki

Jokainen agenttien välinen vuorovaikutus tallennetaan: kuka, kenelle, mitä kysyttiin, mikä vastaus annettiin, mitä LLM-malleja käytettiin, mikä oli kustannus. Täydellinen havainnollisuus.

Monitorointi ja kustannusten hallinta

Rajat agenttikohtaisesti, käyttäjäkohtaisesti, organisaatiokohtaisesti. Reaaliaikainen kustannusdashboard. Hälytykset epätavallisista käytön piikeistä. Reitityksen optimointi datan perusteella.

Eskalaatio ihmiselle

Matala confidence score, kriittinen taloudellinen tai oikeudellinen päätös, reunatapaus → automaattinen eskalaatio ihmisoperaattorille täydellä kontekstilla.

Sovellukset yrityksen sisällä

Kuusi aluetta, joilla moniagenttijärjestelmät tuottavat mitattavaa liiketoiminta-arvoa. Jokainen toteutetaan 4-8 viikon pilottina.

Toimitusjohtajan assistentti

Luokittelee ja vastaa sähköposteihin, varaa palavereja, valmistelee briefejä ennen puheluja, tiivistää pitkiä dokumentteja, monitoroi deadlineja. Tyypillisesti säästää toimitusjohtajalta 10-15 tuntia hallinnollista työtä viikossa.

Compliance ja oikeudellinen monitorointi

Jatkuva lainsäädännön muutosten seuranta, vaikutusten luokittelu yritykseen, hälytykset uusista velvoitteista. Alustavien GDPR-, EU AI Act- ja ISO 27001 -raporttien generointi. Käytäntöjen ja menettelyjen drafit.

Ohjelmistokehitys

Code review, testien generointi, dokumentaation kirjoittaminen, refaktorointi, tietokantamigraatioiden luonti. Kaksi tai kolme ihmistä agenttien kanssa tuottaa 8-10 hengen tiimin arvon.

Asiakaspalvelu

Tikettien luokittelu, automaattiset vastaukset toistuviin kysymyksiin (tietopohjaan perustuen), eskalaatio ihmisille monimutkaisissa tapauksissa. Ensimmäisen vastauksen aika lyhenee tunneista minuutteihin.

Dokumenttianalyysi

Tietojen poiminta sopimuksista, laskuista, tarjouksista. Kaupallisten ehtojen vertailu. Epäjohdonmukaisuuksien ja riskien havaitseminen. Yhteenvetojen ja raporttien generointi lakitiimille.

Myynti ja markkinointi

Some- ja brändimainintojen monitorointi, sentimentin luokittelu, vastausten generointi (ihmisten arvioimat ennen julkaisua), markkinointisisällön luonnostelu.

Chatbot vs. moniagenttijärjestelmä

AspektiYksittäinen chatbot (ChatGPT/Copilot)Moniagenttijärjestelmä
ErikoistuminenYleismalli, „osaa vähän kaikkea"Domainikohtaiset erikoistuneet agentit
Pääsy yrityksen tietoihinRajoitettu (copy-paste chat-ikkunaan)Natiivi (integraatio CRM:ään, ERP:hen, tietokantoihin)
MuistiChat-istunto (tyypillisesti 1-2 h)Episodi- + semanttinen muisti (pysyvä)
Kustannusten reititysYksi malli kaikkiin tehtäviinMonitasoinen (paikallinen → pilvi → premium)
Toimintojen suoritusGeneroi tekstiä, ei suorita toimintojaKutsuu API:ja, kirjoittaa tietokantoihin, lähettää sähköposteja
Audit-jälkiEi (tai alkeellinen)Täydellinen — jokainen vuorovaikutus tallennettu
PII-anonymisointiRiippuu käyttäjästäPakotettu, automaattinen (Anoxy)
Compliance (GDPR, EU AI Act)Vaikea todistaaSisäänrakennettu arkkitehtuuriin

Viittausalusta: HybridCrew

HybridCrew on ESKOM AI:n sisäinen alusta, jota käytämme palveluiden toimittamiseen asiakkaille. Se orkestroi kymmeniä erikoistuneita tekoälyagentteja — kullakin oma roolinsa (esim. organisaatioassistentti, talouden controller, projektipäällikkö, backend-kehittäjä, security reviewer), puolankielinen käyttöliittymä, pääsy työkaluihin ja integraatiot liiketoimintajärjestelmiin.

Keskeiset tekniset ominaisuudet:

  • Monitasoinen LLM-reititys — ilmaisista paikallisista malleista (Ollama) vahvimpiin pilvimalleihin. Mallin valinta automaattinen tehtävän monimutkaisuuden perusteella.
  • Laajat integraatiot — Gmail, Slack, Jira, Confluence, Microsoft Graph, Salesforce, Airtable ja monia muita. Voimme yhdistää minkä tahansa asiakkaan API:n.
  • Email Intelligence — toimitusjohtajan sähköpostin automaattinen luokittelu, aikomusten tunnistus, vastausten generointi hyväksyttäväksi.
  • Anoxy — PII-anonymisointi — omistettu mikropalvelu, joka anonymisoi henkilötiedot ennen niiden lähettämistä ulkoisiin malleihin. GDPR-yhteensopivuus ilman kompromisseja.
  • Episodi- ja semanttinen muisti — agentit oppivat kokemuksesta, voivat hakea domain-tietoa vektoritietokannasta.
  • Kustannusmonitorointi — reaaliaikainen kustannusdashboard agenttikohtaisesti, käyttäjäkohtaisesti, organisaatiokohtaisesti. Rajat ja hälytykset epätavallisista piikeistä.
  • EU AI Act -compliance — järjestelmä luokitellaan rajoitetun riskin tekoälyksi, jolla on Art. 50:n täydet läpinäkyvyysvelvoitteet: tekoälystä ilmoittava banneri, generoidun sisällön merkintä, vientimetatiedot.

Usein kysytyt kysymykset

Mikä on moniagenttijärjestelmä?
Moniagenttinen tekoälyjärjestelmä on arkkitehtuuri, jossa muutama tai useita kymmeniä erikoistuneita tekoälyagentteja työskentelee yhdessä tehtävien ratkaisemiseksi. Jokaisella agentilla on oma roolinsa (esim. toimitusjohtajan assistentti, talouden controller, security reviewer, backend-kehittäjä), omat työkalunsa (API:t, tietokantapääsy, internet), muistinsa (episodi- — mitä se on tehnyt aiemmin, semanttinen — domain-tieto) ja toimintastrategiansa. Yksittäisen yleisen chatbotin sijaan yritys saa tekoälytiimin, jossa on selkeä vastuunjako.
Miten tämä eroaa yksittäisestä ChatGPT:n kaltaisesta chatbotista?
Yksittäinen chatbot selviytyy hyvin yksinkertaisista tekstitehtävistä, mutta sillä hetkellä, kun tehtävä vaatii: pääsyä yrityksen tietokantoihin, integraatiota liiketoimintajärjestelmiin (CRM, ERP, sähköposti), askeleiden sarjan suorittamista, muistia aiemmista vuorovaikutuksista, laadun varmistamista — chatbot ei enää riitä. Moniagenttijärjestelmä ratkaisee tämän erikoistumisella (talousagentti tuntee kirjanpidon, oikeudellinen agentti tuntee GDPR:n), yhteistyöllä (agentit voivat konsultoida toisiaan) ja orkestroinnilla (mekanismi, joka päättää kuka saa minkäkin tehtävän).
Mitä tehtäviä moniagenttijärjestelmälle voi delegoida?
Käytännössä: toimitusjohtajan kalenterin ja inboksin hallinta, asiakassähköpostien luokittelu ja vastaaminen, lainsäädännön muutosten seuranta, talousraporttien valmistelu, pull requestien code review, dokumentaation generointi, työntekijöiden onboardingin automatisointi, tukitiketteihin vastaaminen, dokumenttien (sopimukset, laskut, tarjoukset) analysointi, somen ja brändimainintojen monitorointi, markkinointisisällön generointi. Mitä toistuvampi ja menettelyllinen — sitä paremmin se sopii automatisointiin.
Ovatko moniagenttijärjestelmät kalliita ylläpitää?
Riippuu kustannusarkkitehtuurista. Jos jokainen agentti käyttää vahvinta LLM-mallia jokaiseen tehtävään, kuukausikustannus kasvaa nopeasti. Siksi sovellamme monitasoista LLM-reititystä: pienet tehtävät menevät paikallisille malleille (Ollama asiakkaan GPU:lla — operatiivinen kustannus lähes nolla), keskitason tehtävät halvemmille pilvimalleille, vain monimutkaisimmat päätökset vahvimmille malleille. Tämän ansiosta tyypillinen asiakas maksaa murto-osan siitä, mitä vahvimpien mallien yhtenäinen käyttö maksaisi.
Miten agentit kommunikoivat keskenään?
Kaksi päätietä: synkroninen (agentti A esittää kysymyksen agentille B ja odottaa vastausta) ja asynkroninen (agentti A työntää tehtävän jonoon, agentti B käsittelee sen omaan tahtiinsa, agentti A saa ilmoituksen tuloksesta). Keskitetty orkestrointialusta hallitsee reititystä, säilyttää keskusteluhistorian (audit-jälki) ja kontrolloi kustannuksia (token-rajat agenttikohtaisesti, käyttäjäkohtaisesti). Kaikki viestintä lokitetaan — jokainen agenttien välinen vuorovaikutus voidaan toistaa ja polku tiettyyn päätökseen tarkastaa.
Entä datan turvallisuus moniagenttijärjestelmässä?
Kolme suojakerrosta. Ensinnäkin: PII-anonymisointi (henkilötiedot, tilinumerot, verotunnukset, osoitteet) ennen lähettämistä ulkoisiin LLM-malleihin — käytämme tähän omistettua Anoxy-mikropalvelua, joka skannaa sisällön ennen sen lähtöä. Toiseksi: agenttien eristys — jokaisella agentilla on vähimmäisoikeudet eikä se näe domaininsa ulkopuolista dataa. Kolmanneksi: vaihtoehto ajaa asiakkaan infrastruktuurissa — LLM-mallit voivat pyöriä paikallisesti (Ollama GPU:lla), jolloin data ei poistu asiakkaan verkosta. GDPR-yhteensopiva ja EU AI Actin ohjeiden mukainen.
Voivatko agentit tehdä virheitä? Mitä silloin?
Kyllä — jokainen LLM voi hallusinoida, tehdä loogisia virheitä tai tulkita kontekstin väärin. Lievennysstrategiat: 1) tulosten validointi (esim. talousagentin on palautettava luvut tietyssä formaatissa, validaattori tarkistaa yhteensopivuuden); 2) double-checking kriittisille päätöksille (toinen agentti varmistaa itsenäisesti ensimmäisen tuloksen); 3) eskalaatio ihmiselle (matalalla confidence scorella tai epätavallisissa tapauksissa); 4) audit-jälki (jokainen päätös tallennettu — voidaan kumota, analysoida, promptia parantaa). Kriittiset taloudelliset ja oikeudelliset päätökset eivät koskaan ole autonomisia — ne vaativat ihmisen hyväksynnän.
Miltä moniagenttijärjestelmän käyttöönotto yrityksessä näyttää?
Tyypillisesti neljä vaihetta. 1) Discovery (2-4 viikkoa): automatisoitavien prosessien tunnistaminen, ROI-arviointi kullekin, 2-3 pilottikandidaatin valinta. 2) Pilotti (4-8 viikkoa): ensimmäisten agenttien käyttöönotto valituille prosesseille, vaikutusten mittaaminen, hienosäätö. 3) Skaalaus (3-6 kuukautta): laajentaminen useampiin prosesseihin ja osastoihin, integraatio olemassa oleviin järjestelmiin. 4) Optimointi (jatkuva): agenttien hiominen tuotantodatan perusteella, uusien roolien lisääminen, LLM-mallin kustannusten vähentäminen.
Korvaako moniagenttijärjestelmä työntekijät?
Se korvaa tiettyjä tehtäviä, ei ihmisiä. Yleisin lopputulos: työntekijät saavat aikaa takaisin (tyypillisesti 30-50 % hallinto-osastoilla), jonka he voivat käyttää tehtäviin, jotka vaativat ihmisen harkintaa, luovuutta, suhteiden rakentamista. Yritykset eivät irtisano — päinvastoin, ne kasvavat useammin nopeammin (sama tiimi käsittelee enemmän projekteja). Poikkeus: toistuvat, vähäarvoiset tehtävät (esim. datan manuaalinen kopiointi järjestelmien välillä) — nämä häviävät, eikä kukaan kaipaa niitä.
Mitä teknologioita moniagenttijärjestelmien taustalla on?
Yleisimmät frameworkit: Microsoft AutoGen, CrewAI, LangGraph, Haystack Agents. LLM-mallit: Anthropic Claude, OpenAI GPT, paikalliset Llama ja Mistral, puolalainen Bielik. Vektoritietokannat semanttiselle muistille: Qdrant, Weaviate, pgvector. Viestijonot asynkroniseen toimintaan: Redis, RabbitMQ, Kafka. Monitorointi: Prometheus + Grafana, Sentry, OpenTelemetry. ESKOM AI:ssa yhdistämme tämän kaiken yhdeksi sisäiseksi alustaksi (HybridCrew), jossa on täysi havainnollisuus, kustannusten hallinta ja compliance.

Ensimmäinen pilotti 4-8 viikossa

Valitsemme 2-3 liiketoimintaprosessia, joilla on suurin ROI-potentiaali, ja otamme käyttöön pilottiagentit. Mittaamme vaikutusta, hienosäädämme ja päätämme skaalauksesta.