Pillar page

Sistemas multiagente de IA

Un equipo de agentes IA especializados en lugar de un único chatbot general. Orquestación, enrutado multinivel de modelos LLM, memoria episódica, control de costes y audit trail completo. Internamente utilizamos la plataforma HybridCrew para prestar servicios a clientes.

Un único chatbot al estilo de ChatGPT es una herramienta de propósito general. Entiende el lenguaje, genera texto, responde preguntas — pero en cuanto una tarea requiere una secuencia de acciones, acceso a bases de datos de la empresa, memoria de interacciones previas o verificación de calidad, sus límites quedan al descubierto.

Un sistema multiagente de IA es una arquitectura distinta: un equipo de agentes especializados, cada uno con su rol, herramientas, memoria y estrategia de actuación. El asistente del CEO clasifica el correo. El controller financiero genera informes. El security reviewer escanea el código. El content writer redacta drafts de marketing. Todo coordinado por un orquestador que decide quién recibe cada tarea.

Por qué ganan los sistemas multiagente

La especialización en IA funciona igual que en el negocio. En lugar de una persona que „sabe un poco de todo", un equipo de especialistas entrega mejores resultados. Un agente enfocado en un tipo de tarea — con prompts optimizados, el modelo LLM adecuado, acceso a las herramientas adecuadas — hace el trabajo mejor y más barato que un modelo generalista intentando adivinar el contexto desde cero.

Segunda ventaja: control de costes. La mayoría de tareas no requiere el modelo LLM más potente. Clasificaciones menores, generación de contenido con plantilla, extracción de datos de documentos estructurados — todo esto puede hacerlo un modelo local y gratuito ejecutándose en la GPU del cliente. Solo las decisiones más complejas van a los modelos cloud más potentes. Coste operativo típico: una fracción del que supondría usar de forma uniforme los modelos más potentes.

Tercera: compliance y seguridad. Cada agente tiene permisos mínimos (least privilege). Cada interacción queda registrada (audit trail). Los datos personales se anonimizan antes de enviarse a modelos externos (microservicio Anoxy). Toda la arquitectura se diseña conforme al RGPD y al EU AI Act desde la primera línea de código.

Componentes de un sistema multiagente enterprise

Nueve elementos que deben funcionar conjuntamente para que un sistema multiagente sea apto para uso productivo dentro de una empresa.

Agentes especializados

Cada agente tiene una sola responsabilidad: asistente del CEO, controller financiero, security reviewer, backend developer, content writer. La especialización da mejores resultados que un único chatbot general.

Orquestador

La capa central que decide qué agente recibe cada tarea. Se basa en la clasificación de intención, la disponibilidad de agentes, el coste de los modelos LLM y el contexto de negocio.

Enrutado LLM multinivel

Tareas menores → modelo local (Ollama, coste 0). Medias → modelo cloud más barato. Complejas → los modelos cloud más potentes. Reducción drástica de costes sin perder calidad.

Memoria episódica

Los agentes recuerdan lo que han hecho antes, qué resultados obtuvieron, qué funcionó. Con el tiempo mejoran en las tareas repetitivas — aprenden de cada interacción.

Memoria semántica

Base de datos vectorial de conocimiento de dominio (Qdrant, pgvector). Los agentes pueden encontrar rápidamente casos similares del pasado, documentos de referencia, políticas de la empresa.

Anonimización de datos (Anoxy)

Antes de enviar contenido a modelos LLM externos, el microservicio dedicado Anoxy escanea y anonimiza los datos personales. Cumplimiento del RGPD sin compromisos funcionales.

Audit trail

Cada interacción entre agentes queda registrada: quién, a quién, qué preguntó, qué respuesta obtuvo, qué modelos LLM se usaron, qué coste tuvo. Observabilidad completa.

Monitorización y control de costes

Límites por agente, por usuario, por organización. Dashboard de costes en tiempo real. Alertas ante picos de consumo inusuales. Optimización del enrutado basada en datos.

Escalado a humano

Confidence score bajo, decisión crítica financiera o legal, caso atípico → escalado automático a un operador humano con contexto completo.

Aplicaciones dentro de la empresa

Seis áreas en las que los sistemas multiagente de IA aportan valor de negocio medible. Cada una se despliega como un piloto de 4-8 semanas.

Asistente del CEO

Clasifica y responde correos, agenda reuniones, prepara briefings antes de las llamadas, resume documentos extensos, monitoriza deadlines. Habitualmente ahorra al CEO 10-15 horas de administración semanal.

Compliance y monitorización legal

Monitorización continua de cambios legales, clasificación del impacto sobre la empresa, alertas ante nuevas obligaciones. Generación de informes preliminares de RGPD, EU AI Act, ISO 27001. Drafts de políticas y procedimientos.

Desarrollo de software

Code review, generación de tests, redacción de documentación, refactor, generación de migraciones de base de datos. Dos o tres personas con agentes entregan el valor de un equipo de 8-10 personas.

Atención al cliente

Clasificación de tickets, respuestas automáticas a preguntas recurrentes (basadas en la base de conocimiento), escalado a humano para casos complejos. Reducción del tiempo de respuesta de horas a minutos.

Análisis de documentos

Extracción de datos de contratos, facturas, ofertas. Comparativa de condiciones comerciales. Detección de inconsistencias y riesgos. Generación de resúmenes e informes para el equipo legal.

Ventas y marketing

Monitorización de redes sociales y menciones de marca, clasificación de sentimiento, generación de respuestas (revisadas por humanos antes de su publicación), creación de drafts de contenido de marketing.

Chatbot vs. sistema multiagente

AspectoChatbot único (ChatGPT/Copilot)Sistema multiagente
EspecializaciónModelo general, „sabe un poco de todo"Agentes especializados por dominio
Acceso a datos de empresaLimitado (copia-pega en la ventana de chat)Nativo (integración con CRM, ERP, bases)
MemoriaSesión de chat (típicamente 1-2 h)Memoria episódica + semántica (persistente)
Enrutado de costesUn solo modelo para todas las tareasMultinivel (local → cloud → premium)
Ejecución de accionesGenera texto, no ejecuta accionesLlama APIs, escribe en bases, envía e-mails
Audit trailInexistente (o residual)Completo — cada interacción registrada
Anonimización PIIDepende del usuarioForzada, automática (Anoxy)
Compliance (RGPD, EU AI Act)Difícil de demostrarIncorporada a la arquitectura

Plataforma de referencia: HybridCrew

HybridCrew es una plataforma interna de ESKOM AI que utilizamos para prestar servicios a clientes. Orquesta decenas de agentes IA especializados — cada uno con su rol (p. ej. asistente de organización, controller financiero, project manager, backend developer, security reviewer), interfaz en polaco, acceso a herramientas e integraciones con sistemas de negocio.

Características técnicas clave:

  • Enrutado LLM multinivel — desde modelos locales gratuitos (Ollama) hasta los modelos cloud más potentes. La selección del modelo es automática, basada en la complejidad de la tarea.
  • Integraciones amplias — Gmail, Slack, Jira, Confluence, Microsoft Graph, Salesforce, Airtable y muchas más. Podemos conectar cualquier API del cliente.
  • Email Intelligence — clasificación automática del correo del CEO, reconocimiento de intención, generación de respuestas para aprobar.
  • Anoxy — anonimización PII — un microservicio dedicado que anonimiza los datos personales antes de enviarlos a modelos externos. Cumplimiento del RGPD sin compromisos.
  • Memoria episódica y semántica — los agentes aprenden de la experiencia y pueden acceder al conocimiento de dominio en la base vectorial.
  • Monitorización de costes — dashboard de costes en tiempo real por agente, por usuario, por organización. Límites y alertas ante picos inusuales.
  • Compliance con EU AI Act — el sistema se clasifica como IA de riesgo limitado, con las obligaciones de transparencia completas del Art. 50: banner informativo de IA, marcado de contenido generado, metadatos de exportación.

Preguntas frecuentes

¿Qué es un sistema multiagente?
Un sistema multiagente de IA es una arquitectura en la que varios o varias decenas de agentes IA especializados colaboran para resolver tareas. Cada agente tiene su rol (p. ej. asistente del CEO, controller financiero, security reviewer, backend developer), sus propias herramientas (APIs, acceso a bases de datos, internet), memoria (episódica — lo que hizo antes; semántica — conocimiento de dominio) y estrategia de actuación. En lugar de un único chatbot general, la empresa obtiene un equipo IA con una clara división de responsabilidades.
¿En qué se diferencia de un chatbot único como ChatGPT?
Un chatbot único se desenvuelve bien con tareas de texto simples, pero en cuanto una tarea requiere: acceso a bases de datos de la empresa, integración con sistemas de negocio (CRM, ERP, email), ejecución de una secuencia de pasos, memoria de interacciones previas o verificación de calidad — el chatbot deja de ser suficiente. Un sistema multiagente resuelve esto mediante especialización (el agente financiero conoce la contabilidad, el legal conoce el RGPD), colaboración (los agentes pueden consultarse entre sí) y orquestación (un mecanismo que decide qué agente recibe cada tarea).
¿Qué tareas se pueden delegar a un sistema multiagente?
En la práctica: gestión del calendario y del correo del CEO, clasificación y respuesta a correos de clientes, monitorización de cambios legales, preparación de informes financieros, code review de pull requests, generación de documentación, automatización del onboarding de empleados, gestión de tickets de soporte, análisis de documentos (contratos, facturas, ofertas), monitorización de redes sociales y menciones de marca, generación de contenido de marketing. Cuanto más repetitivo y procedimental — mejor candidato a automatización.
¿Son caros de operar los sistemas multiagente?
Depende de la arquitectura de costes. Si cada agente usa el modelo LLM más potente para cada tarea, el coste mensual se dispara enseguida. Por eso aplicamos enrutado LLM multinivel: las tareas menores van a modelos locales (Ollama sobre la GPU del cliente — coste operativo cercano a cero), las medias a modelos cloud más baratos, solo las decisiones más complejas a los modelos más potentes. Gracias a ello, un cliente típico paga una fracción de lo que supondría usar de forma uniforme los modelos más potentes.
¿Cómo se comunican los agentes entre sí?
Dos rutas principales: síncrona (el agente A pregunta al agente B y espera la respuesta) y asíncrona (el agente A encola una tarea, el agente B la procesa a su ritmo, el agente A recibe una notificación con el resultado). La plataforma central de orquestación gestiona el enrutado, conserva el historial de la conversación (audit trail) y controla el coste (límites de tokens por agente, por usuario). Toda la comunicación queda registrada — cualquier interacción entre agentes puede reproducirse y se puede inspeccionar el camino hasta una decisión concreta.
¿Qué pasa con la seguridad de los datos en un sistema multiagente?
Tres capas de protección. Primera: anonimización de PII (datos personales, números de cuenta, identificadores fiscales, direcciones) antes de enviarse a modelos LLM externos — utilizamos el microservicio dedicado Anoxy, que escanea el contenido antes de su envío. Segunda: aislamiento de agentes — cada agente tiene permisos mínimos (least privilege) y no ve datos fuera de su dominio. Tercera: opción de operar sobre la infraestructura del cliente — los modelos LLM pueden correr localmente (Ollama en GPU), sin que los datos salgan de la red del cliente. Cumplimiento del RGPD y alineación con la EU AI Act.
¿Pueden los agentes cometer errores? ¿Y entonces?
Sí, cualquier modelo LLM puede alucinar, cometer errores lógicos o interpretar mal el contexto. Estrategias de mitigación: 1) validación de resultados (p. ej. el agente financiero debe devolver cifras en un formato concreto, un validador comprueba la conformidad); 2) double-checking en decisiones críticas (un segundo agente verifica independientemente el resultado del primero); 3) escalado a humano (ante confidence score bajo o casos atípicos); 4) audit trail (cada decisión queda registrada — se puede deshacer, analizar, mejorar el prompt). Las decisiones financieras y legales críticas nunca son autónomas — requieren la aprobación humana.
¿Cómo es el despliegue de un sistema multiagente en una empresa?
Habitualmente cuatro fases. 1) Discovery (2-4 semanas): identificación de procesos a automatizar, evaluación del ROI de cada uno, selección de 2-3 candidatos piloto. 2) Piloto (4-8 semanas): despliegue de los primeros agentes para los procesos elegidos, medición del impacto, ajuste fino. 3) Escalado (3-6 meses): expansión a más procesos y departamentos, integración con los sistemas existentes. 4) Optimización (continua): refinado de los agentes a partir de datos de producción, incorporación de nuevos roles, reducción del coste de los modelos LLM.
¿Sustituirá un sistema multiagente a los empleados?
Sustituye tareas concretas, no a personas. Resultado más habitual: los empleados recuperan tiempo (típicamente 30-50% en los departamentos administrativos) que pueden dedicar a tareas que requieren criterio humano, creatividad o construcción de relaciones. Las empresas no despiden — al contrario, crecen más rápido (más proyectos atendidos por el mismo equipo). Excepción: las tareas repetitivas de bajo valor (p. ej. copiar datos manualmente entre sistemas) — desaparecen, y nadie las echa de menos.
¿Qué tecnologías hay detrás de los sistemas multiagente?
Frameworks más comunes: Microsoft AutoGen, CrewAI, LangGraph, Haystack Agents. Modelos LLM: Anthropic Claude, OpenAI GPT, modelos locales Llama, Mistral, el polaco Bielik. Bases vectoriales para memoria semántica: Qdrant, Weaviate, pgvector. Colas de mensajes para async: Redis, RabbitMQ, Kafka. Monitorización: Prometheus + Grafana, Sentry, OpenTelemetry. En ESKOM AI combinamos todo esto en una plataforma interna única (HybridCrew) con observabilidad completa, control de costes y compliance.

Primer piloto en 4-8 semanas

Seleccionamos 2-3 procesos de negocio con mayor potencial de ROI y desplegamos agentes piloto. Medimos el impacto, ajustamos y decidimos sobre el escalado.