Pillar page

Sistemes multiagent d'IA

Un equip d'agents d'IA especialitzats en lloc d'un sol chatbot generalista. Orquestració, routing multinivell de models LLM, memòria episòdica, control de costos i rastre d'auditoria. Internament fem servir la plataforma HybridCrew per prestar serveis als clients.

Un sol chatbot a l'estil de ChatGPT és una eina d'ús general. Entén bé el llenguatge, genera textos i respon preguntes — però quan la tasca requereix una seqüència d'accions, accés a bases de dades corporatives, memòria d'interaccions anteriors o verificació de qualitat, les seves limitacions es fan evidents.

Un sistema multiagent d'IA és una arquitectura diferent: un equip d'agents especialitzats, cadascun amb el seu rol, eines, memòria i estratègia d'actuació. L'assistent del CEO classifica el correu. El controller financer genera informes. El revisor de seguretat escaneja codi. El redactor de continguts escriu esborranys de màrqueting. Tot coordinat per un orquestrador que decideix qui rep cada tasca.

D'on ve l'avantatge dels sistemes multiagent

L'especialització en IA funciona igual que als negocis. En lloc d'una persona que «sap una mica de tot», un equip d'especialistes obté millors resultats. Un agent centrat en un tipus concret de tasca — amb prompts optimitzats, el model LLM adequat i accés a les eines correctes — fa la feina millor i més barata que un model universal intentant endevinar el context des de zero.

Segon avantatge: control de costos. La majoria de tasques no requereixen el model LLM més potent. Classificacions simples, generació de continguts per plantilla, extracció de dades de documents estructurats — tot això ho poden fer models locals i gratuïts executats a la GPU del client. Només les decisions més complexes arriben als models de núvol més potents. Cost operatiu típic: una fracció del que costaria fer servir uniformement els models més potents.

Tercer: compliance i seguretat. Cada agent té els permisos mínims (least privilege). Cada interacció queda registrada (rastre d'auditoria). Les dades personals s'anonimitzen abans d'enviar-les a models externs (microservei Anoxy). Tota l'arquitectura es dissenya d'acord amb el RGPD i l'EU AI Act des de la primera línia de codi.

Components d'un sistema multiagent enterprise

Nou elements que han de funcionar conjuntament perquè un sistema multiagent sigui apte per a ús de producció a l'empresa.

Agents especialitzats

Cada agent té una sola responsabilitat: assistent del CEO, controller financer, revisor de seguretat, desenvolupador de backend, redactor de continguts. L'especialització dona millors resultats que un sol chatbot generalista.

Orquestrador

Capa central que decideix quin agent rep cada tasca. Es basa en la classificació d'intencions, la disponibilitat d'agents, el cost dels models LLM i el context de negoci.

Routing multinivell de LLM

Tasques petites → model local (Ollama, cost $0). Mitjanes → model núvol més econòmic. Complexes → models de núvol més potents. Reducció dràstica de costos sense perdre qualitat.

Memòria episòdica

Els agents recorden què han fet abans, quins resultats han obtingut i què ha funcionat. Amb el temps milloren en tasques repetitives — aprenen de cada interacció.

Memòria semàntica

Base de coneixement vectorial de domini (Qdrant, pgvector). Els agents poden trobar ràpidament casos similars del passat, documents de referència i polítiques corporatives.

Anonimització de dades (Anoxy)

Abans d'enviar contingut a models LLM externs, un microservei dedicat (Anoxy) escaneja i anonimitza les dades personals. Conformitat amb el RGPD sense renunciar a funcionalitat.

Rastre d'auditoria

Cada interacció entre agents queda registrada: qui, a qui, què ha preguntat, quina resposta ha rebut, quins models LLM s'han fet servir i quin cost ha tingut. Observabilitat completa.

Monitoratge i control de costos

Límits per agent, per usuari i per organització. Dashboard amb costos en temps real. Alertes davant augments inusuals de consum. Optimització del routing basada en dades.

Escalada a humans

Confidence score baix, decisió financera o legal crítica, cas atípic → escalada automàtica a un operador humà amb el context complet.

Aplicacions a l'empresa

Sis àmbits en què els sistemes multiagent d'IA aporten valor de negoci mesurable. Cadascun s'implanta com a pilot de 4-8 setmanes.

Assistent del CEO

Classifica i respon correus, organitza reunions, prepara briefings abans de trucades, resumeix documents llargs i fa seguiment dels deadlines. Típicament estalvia al CEO 10-15 hores setmanals d'administració.

Compliance i monitoratge legal

Monitoratge constant de canvis legislatius, classificació del seu impacte sobre l'empresa i alertes davant noves obligacions. Generació d'informes preliminars de RGPD, EU AI Act i ISO 27001. Esborranys de polítiques i procediments.

Desenvolupament de programari

Code review, generació de proves, redacció de documentació, refactoring i generació de migracions de base de dades. Dues o tres persones amb agents aporten el valor d'un equip de 8-10.

Atenció al client

Classificació de tickets, respostes automàtiques a preguntes repetitives (basades en la base de coneixement) i escalada a humans en casos complexos. Reducció del temps de resposta d'hores a minuts.

Anàlisi de documents

Extracció de dades de contractes, factures i ofertes. Comparació de condicions comercials. Detecció d'incoherències i riscos. Generació de resums i informes per a l'equip jurídic.

Vendes i màrqueting

Monitoratge de xarxes socials i mencions de marca, classificació de sentiment, generació de respostes (revisades per un humà abans de publicar) i creació de continguts preliminars de màrqueting.

Chatbot vs. sistema multiagent

AspecteChatbot únic (ChatGPT/Copilot)Sistema multiagent
EspecialitzacióModel general, «sap una mica de tot»Agents especialitzats per domini
Accés a dades corporativesLimitat (còpia a la finestra del xat)Natiu (integració amb CRM, ERP, bases de dades)
MemòriaSessió de xat (típicament 1-2 hores)Memòria episòdica + semàntica (persistent)
Routing de costosUn sol model per a totes les tasquesMultinivell (local → núvol → premium)
Execució d'accionsGenera text, no executa accionsCrida APIs, escriu a bases de dades, envia correus
Rastre d'auditoriaInexistent (o residual)Complet — cada interacció registrada
Anonimització de PIIDepèn de l'usuariForçada i automàtica (Anoxy)
Compliance (RGPD, EU AI Act)Difícil de demostrarIntegrat a l'arquitectura

Plataforma de referència: HybridCrew

HybridCrew és una plataforma interna d'ESKOM AI que utilitzem per prestar serveis als clients. Orquestra desenes d'agents d'IA especialitzats — cadascun amb el seu rol (per exemple, assistent d'organització, controller financer, project manager, desenvolupador de backend, revisor de seguretat), interfície en polonès, accés a eines i integracions amb sistemes de negoci.

Característiques tècniques clau:

  • Routing multinivell de LLM — des dels models locals gratuïts (Ollama) fins als models de núvol més potents. L'elecció del model és automàtica, segons la complexitat de la tasca.
  • Àmplies integracions — Gmail, Slack, Jira, Confluence, Microsoft Graph, Salesforce, Airtable i moltes altres. Podem connectar qualsevol API del client.
  • Email Intelligence — classificació automàtica del correu del CEO, reconeixement d'intencions i generació de respostes per aprovar.
  • Anoxy — anonimització de PII — microservei dedicat que anonimitza dades personals abans d'enviar-les a models externs. Conformitat amb el RGPD sense concessions.
  • Memòria episòdica i semàntica — els agents aprenen de l'experiència i poden recórrer al coneixement de domini d'una base vectorial.
  • Monitoratge de costos — dashboard amb costos en temps real per agent, usuari i organització. Límits i alertes davant augments inusuals.
  • Compliance amb l'EU AI Act — sistema classificat com a IA de risc limitat, amb les obligacions de transparència completes (Art. 50): bàner que informa de la presència d'IA, marcatge dels continguts generats i metadades a les exportacions.

Preguntes freqüents

Què és un sistema multiagent?
Un sistema multiagent d'IA és una arquitectura en què diversos agents d'IA especialitzats col·laboren per resoldre tasques. Cada agent té el seu rol (per exemple, assistent del CEO, controller financer, revisor de seguretat, desenvolupador de backend), les seves pròpies eines (API, accés a bases de dades, internet), memòria (episòdica — què ha fet abans, semàntica — coneixement de domini) i estratègia d'actuació. En lloc d'un sol chatbot generalista, l'empresa rep un equip d'IA amb un repartiment clar de responsabilitats.
En què es diferencia d'un sol chatbot a l'estil de ChatGPT?
Un sol chatbot resol bé tasques textuals senzilles, però quan la feina requereix: accés a bases de dades corporatives, integració amb sistemes de negoci (CRM, ERP, correu), execució d'una seqüència de passos, memòria d'interaccions anteriors i verificació de qualitat — el chatbot deixa de ser suficient. Un sistema multiagent ho resol mitjançant l'especialització (l'agent financer coneix la comptabilitat, l'agent legal coneix el RGPD), la col·laboració (els agents es poden consultar entre ells) i l'orquestració (mecanisme que decideix qui rep cada tasca).
Quines tasques es poden delegar a un sistema multiagent?
A la pràctica: gestió de l'agenda i el correu del CEO, classificació i resposta a correus de clients, monitoratge de canvis legislatius, preparació d'informes financers, code review de pull requests, generació de documentació, automatització de l'onboarding de personal, atenció de tickets de suport, anàlisi de documents (contractes, factures, ofertes), monitoratge de xarxes socials i mencions de marca, i generació de continguts de màrqueting. Com més repetitiva i descriptible per procediment, més s'hi adapta una tasca.
Els sistemes multiagent són cars de mantenir?
Depèn de l'arquitectura de costos. Si cada agent fa servir el model LLM més potent per a cada tasca, el cost mensual creix ràpid. Per això apliquem un routing multinivell de models LLM: les tasques petites van a models locals (Ollama sobre GPU a la infraestructura del client — cost operatiu pràcticament zero), les tasques mitjanes a models de núvol més econòmics i només les decisions més complexes als models més potents. Així, un client típic paga una fracció del que costaria fer servir uniformement els models més potents.
Com es comuniquen els agents entre ells?
Dues vies principals: síncrona (l'agent A fa una pregunta a l'agent B i espera resposta) i asíncrona (l'agent A posa la tasca a una cua, l'agent B la processa al seu ritme i l'agent A rep una notificació amb el resultat). La plataforma central d'orquestració gestiona el routing, manté l'historial de converses (rastre d'auditoria) i controla els costos (límits de tokens per agent i per usuari). Tota la comunicació queda registrada — es pot reproduir qualsevol interacció entre agents i veure com es va arribar a una decisió concreta.
Què passa amb la seguretat de les dades en un sistema multiagent?
Tres capes de protecció. Primera: anonimització de PII (dades personals, números de compte, NIF, adreces) abans d'enviar-les a models LLM externs — fem servir el microservei Anoxy, que escaneja el contingut abans de l'enviament. Segona: aïllament d'agents — cada agent té els permisos mínims (least privilege) i no veu dades fora del seu domini. Tercera: opció d'executar-se a la infraestructura del client — els models LLM poden funcionar localment (Ollama sobre GPU), sense que les dades surtin de la xarxa del client. Conformitat amb el RGPD i les directrius de l'EU AI Act.
Els agents poden equivocar-se? Què fer llavors?
Sí, qualsevol model LLM pot al·lucinar, cometre errors lògics o interpretar malament el context. Estratègies de mitigació: 1) validació de resultats (per exemple, l'agent financer ha de retornar xifres en un format concret, i un validador comprova la conformitat); 2) double-checking per a decisions crítiques (un segon agent revisa de manera independent el resultat del primer); 3) escalada a un humà (davant confidence score baix o casos atípics); 4) rastre d'auditoria (cada decisió queda registrada — es pot desfer, analitzar i millorar el prompt). Les decisions financeres i legals crítiques mai no són autònomes — requereixen aprovació humana.
Com és la implantació d'un sistema multiagent a l'empresa?
Típicament, quatre fases. 1) Discovery (2-4 setmanes): identificació de processos a automatitzar, avaluació del ROI de cadascun i tria de 2-3 candidats per al pilot. 2) Pilot (4-8 setmanes): desplegament dels primers agents per als processos triats, mesura de l'impacte i ajustaments. 3) Escalat (3-6 mesos): extensió a més processos i departaments, i integració amb els sistemes existents. 4) Optimització (continua): millora dels agents a partir de les dades de producció, addició de nous rols, integracions amb sistemes nous, millora de compliance i reducció de costos dels models LLM.
Un sistema multiagent substituirà els treballadors?
Substitueix tasques concretes, però no persones. Efecte més habitual: els treballadors recuperen temps (típicament un 30-50% en departaments administratius) que poden dedicar a tasques que requereixen judici humà, creativitat i construcció de relacions. Les empreses no acomiaden — al contrari, sovint creixen més ràpid (més projectes gestionats pel mateix equip). Excepció: tasques repetitives de baix valor (per exemple, copiar dades a mà entre sistemes) — desapareixen i ningú no les troba a faltar.
Quines tecnologies hi ha darrere dels sistemes multiagent?
Frameworks més habituals: Microsoft AutoGen, CrewAI, LangGraph, Haystack Agents. Models LLM: Anthropic Claude, OpenAI GPT, models locals Llama, Mistral i el polonès Bielik. Bases de dades vectorials per a la memòria semàntica: Qdrant, Weaviate, pgvector. Cues de missatges per a l'asincronia: Redis, RabbitMQ, Kafka. Monitoratge: Prometheus + Grafana, Sentry, OpenTelemetry. A ESKOM AI ho integrem tot dins d'una plataforma interna (HybridCrew) amb observabilitat completa, control de costos i compliance.

Primer pilot en 4-8 setmanes

Triem 2-3 processos de negoci amb el major potencial de ROI i desplegem agents pilot. Mesurem l'impacte, ajustem i decidim l'escalat.