Pillar page

Multi-agentní AI systémy

Tým specializovaných AI agentů místo jediného obecného chatbota. Orchestrace, víceúrovňový routing LLM modelů, epizodická paměť, kontrola nákladů a audit trail. Interně používáme platformu HybridCrew k poskytování služeb klientům.

Pojďme si promluvit o nasazení Zobrazit HybridCrew

Jediný chatbot ve stylu ChatGPT je nástroj obecného použití. Skvěle rozumí jazyku, generuje texty, odpovídá na otázky — ale když úkol vyžaduje sekvenci akcí, přístup k firemním databázím, paměť o předchozích interakcích nebo ověření kvality, jeho omezení se začnou projevovat.

Multi-agentní AI systém je jiná architektura: tým specializovaných agentů, každý s vlastní rolí, nástroji, pamětí a strategií činnosti. Asistent ředitele klasifikuje poštu. Finanční controller generuje reporty. Security reviewer skenuje kód. Content writer píše marketingové drafty. Vše koordinováno orchestrátorem, který rozhoduje, kdo dostane který úkol.

Odkud výhoda multi-agentních systémů

Specializace v AI funguje stejně jako v byznysu. Místo jedné osoby, která „umí všechno trochu", dosahuje lepších výsledků tým specialistů. Agent zaměřený na jeden typ úkolů — s optimalizovanými prompty, vhodným LLM modelem, přístupem ke správným nástrojům — vykonává práci lépe a levněji než univerzální model snažící se uhodnout kontext od nuly.

Druhá výhoda: kontrola nákladů. Většina úkolů nevyžaduje nejsilnější LLM model. Drobné klasifikace, generování šablonových obsahů, extrakce dat ze strukturovaných dokumentů — to všechno mohou provést lokální, bezplatné modely spuštěné na GPU klienta. Jen nejsložitější rozhodnutí směřují k nejsilnějším cloudovým modelům. Typický provozní náklad: zlomek toho, co při jednotném používání nejsilnějších modelů.

Třetí: compliance a bezpečnost. Každý agent má minimální oprávnění (least privilege). Každá interakce je logována (audit trail). Osobní údaje jsou anonymizovány před odesláním do externích modelů (mikroslužba Anoxy). Celá architektura je navržena v souladu s GDPR a EU AI Act od první řádky kódu.

Komponenty multi-agentního systému enterprise třídy

Devět prvků, které musí fungovat dohromady, aby multi-agentní systém byl vhodný k produkčnímu použití ve firmě.

Specializovaní agenti

Každý agent má jednu odpovědnost: asistent ředitele, finanční controller, security reviewer, backend developer, content writer. Specializace dává lepší výsledky než jeden obecný chatbot.

Orchestrátor

Centrální vrstva rozhodující, který agent dostane který úkol. Vychází z klasifikace záměru, dostupnosti agentů, nákladů LLM modelů a obchodního kontextu.

Víceúrovňový LLM routing

Drobné úkoly → lokální model (Ollama, nulové náklady). Střední → levnější cloudový model. Složité → nejsilnější cloudové modely. Drastická redukce nákladů bez ztráty kvality.

Epizodická paměť

Agenti si pamatují, co dělali dříve, jaké byly výsledky, co fungovalo. Časem se zlepšují v opakovaných úkolech — učí se z každé interakce.

Sémantická paměť

Vektorová znalostní báze doménových znalostí (Qdrant, pgvector). Agenti rychle najdou podobné případy z minulosti, referenční dokumenty, firemní politiky.

Anonymizace dat (Anoxy)

Před odesláním obsahu do externích LLM modelů dedikovaná mikroslužba Anoxy skenuje a anonymizuje osobní údaje. Shoda s GDPR bez funkčních kompromisů.

Audit trail

Každá interakce mezi agenty zaznamenána: kdo, komu, co se zeptal, jakou dostal odpověď, jaké LLM modely byly použity, jaký náklad. Plná pozorovatelnost.

Monitoring a kontrola nákladů

Limity per agent, per uživatel, per organizace. Dashboard s náklady v reálném čase. Alerty při netypickém růstu spotřeby. Optimalizace routingu na základě dat.

Eskalace k člověku

Nízký confidence score, kritické finanční nebo právní rozhodnutí, netypický případ → automatická eskalace k lidskému operátorovi s plným kontextem.

Využití ve firmě

Šest oblastí, ve kterých multi-agentní AI systémy přinášejí měřitelnou obchodní hodnotu. Každá je nasazena jako pilot 4-8 týdnů.

Asistent ředitele

Klasifikuje a odpovídá na e-maily, domlouvá schůzky, připravuje briefy před rozhovory, shrnuje dlouhé dokumenty, hlídá deadliny. Typicky šetří řediteli 10-15 hodin administrativy týdně.

Compliance a právní monitoring

Trvalý monitoring změn v právu, klasifikace dopadu na firmu, alerty při nových povinnostech. Generování vstupních reportů GDPR, EU AI Act, ISO 27001. Drafty politik a procedur.

Vývoj software

Code review, generování testů, psaní dokumentace, refaktoring, generování databázových migrací. Dva nebo tři lidé s agenty dodávají hodnotu týmu o velikosti 8-10 osob.

Zákaznický servis

Klasifikace tiketů, automatické odpovědi na opakované otázky (založené na znalostní bázi), eskalace k člověku u složitých případů. Zkrácení doby odezvy z hodin na minuty.

Analýza dokumentů

Extrakce dat ze smluv, faktur, nabídek. Porovnávání obchodních podmínek. Detekce nesrovnalostí a rizik. Generování souhrnů a reportů pro právní tým.

Prodej a marketing

Monitoring sociálních sítí a zmínek o značce, klasifikace sentimentu, generování odpovědí (kontrolovaných člověkem před zveřejněním), tvorba vstupních marketingových obsahů.

Chatbot vs. multi-agentní systém

Aspekt	Jediný chatbot (ChatGPT/Copilot)	Multi-agentní systém
Specializace	Obecný model, „umí všechno trochu"	Specializovaní agenti per doména
Přístup k firemním datům	Omezený (kopírování do okna chatu)	Nativní (integrace s CRM, ERP, databázemi)
Paměť	Session chatu (typicky 1-2 hod)	Epizodická + sémantická paměť (trvalá)
Routing nákladů	Jeden model pro všechny úkoly	Víceúrovňový (lokální → cloud → premium)
Vykonávání akcí	Generuje text, neprovádí akce	Volá API, zapisuje do databází, posílá e-maily
Audit trail	Žádný (nebo zlomkový)	Plný — každá interakce zaznamenána
Anonymizace PII	Závisí na uživateli	Vynucená, automatická (Anoxy)
Compliance (GDPR, EU AI Act)	Obtížné prokázat	Zabudovaná v architektuře

Referenční platforma: HybridCrew

HybridCrew je interní platforma ESKOM AI, kterou používáme k poskytování služeb klientům. Orchestruje desítky specializovaných AI agentů — každý s vlastní rolí (např. organizační asistent, finanční controller, project manager, backend developer, security reviewer), českým/polským rozhraním, přístupem k nástrojům a integracemi s obchodními systémy.

Klíčové technické vlastnosti:

Víceúrovňový LLM routing — od bezplatných lokálních modelů (Ollama) po nejsilnější cloudové modely. Volba modelu automatická, na základě složitosti úkolu.
Široké integrace — Gmail, Slack, Jira, Confluence, Microsoft Graph, Salesforce, Airtable a mnoho dalších. Můžeme připojit libovolné klientské API.
Email Intelligence — automatická klasifikace pošty ředitele, rozpoznávání záměru, generování odpovědí ke schválení.
Anoxy — anonymizace PII — dedikovaná mikroslužba anonymizující osobní údaje před odesláním do externích modelů. Shoda s GDPR bez kompromisů.
Epizodická a sémantická paměť — agenti se učí ze zkušeností, mohou sahat po doménových znalostech ve vektorové databázi.
Monitoring nákladů — dashboard s náklady v reálném čase per agent, per uživatel, per organizace. Limity a alerty při netypickém růstu.
EU AI Act compliance — systém klasifikován jako AI omezeného rizika, s plnými povinnostmi transparentnosti (Art. 50): banner informující o AI, označení generovaných obsahů, metadata exportů.

Často kladené otázky

Co je multi-agentní systém?

Multi-agentní AI systém je architektura, ve které několik nebo několik desítek specializovaných AI agentů spolupracuje na řešení úkolů. Každý agent má svou roli (např. asistent ředitele, finanční controller, security reviewer, backend developer), vlastní nástroje (API, přístup k databázím, internet), paměť (epizodickou — co dělal dříve, sémantickou — doménové znalosti) a strategii činnosti. Místo jednoho obecného chatbota firma dostává AI tým s jasným rozdělením odpovědností.

Čím se to liší od jediného chatbota ve stylu ChatGPT?

Jediný chatbot si skvěle poradí s jednoduchými textovými úkoly, ale když úkol vyžaduje: přístup k firemním databázím, integraci s obchodními systémy (CRM, ERP, email), provedení sekvence kroků, paměť o předchozích interakcích, ověření kvality — chatbot přestává stačit. Multi-agentní systém to řeší přes specializaci (finanční agent zná účetnictví, právní agent zná GDPR), spolupráci (agenti se umí konzultovat) a orchestraci (mechanismus volby, který agent dostane který úkol).

Jaké úkoly lze delegovat na multi-agentní systém?

V praxi: správa kalendáře a pošty ředitele, klasifikace a odpovídání na e-maily klientů, monitoring legislativních změn, příprava finančních reportů, code review pull requestů, generování dokumentace, automatizace onboardingu zaměstnanců, obsluha support tiketů, analýza dokumentů (smluv, faktur, nabídek), monitoring sociálních sítí a zmínek o značce, generování marketingových obsahů. Čím opakovanější a popsatelnější procedurou — tím lépe se k automatizaci hodí.

Jsou multi-agentní systémy drahé na provoz?

Záleží na nákladové architektuře. Pokud každý agent používá nejsilnější LLM model pro každý úkol, měsíční náklady rychle rostou. Proto uplatňujeme víceúrovňový routing LLM modelů: drobné úkoly směřují k lokálním modelům (Ollama na GPU v infrastruktuře klienta — provozní náklad blízký nule), střední úkoly k levnějším cloudovým modelům, jen nejsložitější rozhodnutí k nejsilnějším modelům. Díky tomu typický klient platí zlomek toho, co při jednotném použití nejsilnějších modelů.

Jak spolu agenti komunikují?

Dvě hlavní cesty: synchronní (agent A se zeptá agenta B a čeká na odpověď) a asynchronní (agent A vhodí úkol do fronty, agent B zpracovává svým tempem, agent A dostává notifikaci o výsledku). Centrální orchestrační platforma řídí routing, uchovává historii konverzace (audit trail), kontroluje náklady (limity tokenů per agent, per uživatel). Veškerá komunikace je logována — lze přehrát každou interakci mezi agenty a zkontrolovat, jak došlo ke konkrétnímu rozhodnutí.

Co s bezpečností dat v multi-agentním systému?

Tři vrstvy zabezpečení. Za prvé: anonymizace PII (osobní údaje, čísla účtů, DIČ, adresy) před odesláním do externích LLM modelů — používáme k tomu mikroslužbu Anoxy, která skenuje obsah před odesláním. Za druhé: izolace agentů — každý agent má minimální oprávnění (least privilege), nevidí data mimo svou doménu. Za třetí: možnost provozu na infrastruktuře klienta — LLM modely mohou běžet lokálně (Ollama na GPU), bez opouštění dat za hranice klientské sítě. Shoda s GDPR a směrnicemi EU AI Act.

Mohou agenti dělat chyby? Co pak?

Ano, každý LLM model může halucinovat, dělat logické chyby nebo nesprávně interpretovat kontext. Strategie minimalizace: 1) validace výsledků (např. finanční agent musí vrátit čísla v daném formátu, validátor kontroluje shodu); 2) double-checking u kritických rozhodnutí (druhý agent nezávisle ověřuje výsledek prvního); 3) eskalace k člověku (při nízkém confidence score nebo netypickém případu); 4) audit trail (každé rozhodnutí zaznamenáno — lze vrátit, analyzovat, zlepšit prompt). Kritická finanční a právní rozhodnutí nikdy nejsou autonomní — vyžadují schválení člověka.

Jak vypadá nasazení multi-agentního systému ve firmě?

Typicky čtyři fáze. 1) Discovery (2-4 týdny): identifikace procesů k automatizaci, hodnocení ROI pro každý, výběr 2-3 pilotních. 2) Pilot (4-8 týdnů): nasazení prvních agentů pro vybrané procesy, měření dopadu, doladění. 3) Škálování (3-6 měsíců): rozšíření na další procesy a oddělení, integrace se stávajícími systémy. 4) Optimalizace (continuous): zdokonalování agentů na základě dat z produkce, přidávání nových rolí, redukce nákladů LLM modelů.

Nahradí multi-agentní systém zaměstnance?

Nahradí konkrétní úkoly, ale ne lidi. Nejčastější efekt: zaměstnanci získávají zpět čas (typicky 30-50 % v administrativních odděleních), který mohou věnovat úkolům vyžadujícím lidský úsudek, kreativitu, budování vztahů. Firmy nepropouštějí — naopak častěji rostou rychleji (více projektů obsluhováno stejným týmem). Výjimka: opakované úkoly nízké hodnoty (např. ruční kopírování dat mezi systémy) — ty mizí a nikdo za nimi nesmutní.

Jaké technologie stojí za multi-agentními systémy?

Nejčastější frameworky: Microsoft AutoGen, CrewAI, LangGraph, Haystack Agents. LLM modely: Anthropic Claude, OpenAI GPT, lokální modely Llama, Mistral, polský Bielik. Vektorové databáze pro sémantickou paměť: Qdrant, Weaviate, pgvector. Message queues pro async: Redis, RabbitMQ, Kafka. Monitoring: Prometheus + Grafana, Sentry, OpenTelemetry. V ESKOM AI to vše spojujeme do jedné interní platformy (HybridCrew) s plnou pozorovatelností, kontrolou nákladů a compliance.

První pilot za 4-8 týdnů

Vybíráme 2-3 obchodní procesy s největším potenciálem ROI a nasazujeme pilotní agenty. Měříme dopad, dolaďujeme a rozhodujeme o škálování.

Domluvit hovor o pilotu Vývoj s AI