Páxina pillar

Sistemas multiaxente de IA

Equipo de axentes IA especializados no canto dun único chatbot xeral. Orquestración, roteamento multinivel de modelos LLM, memoria episódica, control de custos e rexistro de auditoría. Internamente usamos a plataforma HybridCrew para prestar servizos aos clientes.

Falemos do despregamento Ver HybridCrew

Un chatbot único do estilo de ChatGPT é unha ferramenta de uso xeral. Comprende moi ben a linguaxe, xera textos, responde preguntas — pero cando a tarefa esixe unha secuencia de accións, acceso a bases de datos da empresa, memoria das interaccións previas ou verificación da calidade, as súas limitacións fanse visibles.

Un sistema multiaxente de IA é unha arquitectura diferente: un equipo de axentes especializados, cada un co seu papel, ferramentas, memoria e estratexia de acción. O asistente do CEO clasifica o correo. O controller financeiro xera informes. O security reviewer escanea o código. O content writer escribe borradores de marketing. Todo coordinado por un orquestrador que decide quen recibe cada tarefa.

De onde vén a vantaxe dos sistemas multiaxente

A especialización na IA funciona igual que no negocio. En vez dunha persoa que „sabe un pouco de todo", obtéñense mellores resultados cun equipo de especialistas. Un axente centrado nun tipo de tarefa — con prompts optimizados, modelo LLM axeitado, acceso ás ferramentas correctas — fai o traballo mellor e máis barato que un modelo universal tentando adiviñar o contexto desde cero.

Segunda vantaxe: control de custos. A maioría das tarefas non require o modelo LLM máis potente. Pequenas clasificacións, xeración de contidos a partir de plantillas, extracción de datos de documentos estruturados — todo isto pódeno facer modelos locais e gratuítos executados na GPU do cliente. Só as decisións máis complexas chegan aos modelos en nube máis potentes. Custo operativo típico: unha fracción do que sería usando uniformemente os modelos máis potentes.

Terceira: compliance e seguridade. Cada axente ten os permisos mínimos (least privilege). Cada interacción queda rexistrada (rexistro de auditoría). Os datos persoais son anonimizados antes de enviarse aos modelos externos (microservizo Anoxy). Toda a arquitectura está deseñada conforme a RXPD e ao EU AI Act desde a primeira liña de código.

Compoñentes dun sistema multiaxente de clase enterprise

Nove elementos que deben funcionar xuntos para que un sistema multiaxente sexa apto para o uso produtivo nunha empresa.

Axentes especializados

Cada axente ten unha única responsabilidade: asistente do CEO, controller financeiro, security reviewer, backend developer, content writer. A especialización dá mellores resultados que un único chatbot xeral.

Orquestrador

Capa central que decide que axente recibirá cada tarefa. Baséase na clasificación de intencións, dispoñibilidade dos axentes, custos dos modelos LLM e contexto de negocio.

Roteamento multinivel de LLM

Tarefas pequenas → modelo local (Ollama, custo $0). Medias → modelo en nube máis barato. Complexas → modelos en nube máis potentes. Redución drástica de custos sen perda de calidade.

Memoria episódica

Os axentes lembran o que fixeron antes, cales foron os resultados, que funcionou. Co tempo melloran nas tarefas repetitivas — aprenden de cada interacción.

Memoria semántica

Base de coñecemento de dominio vectorial (Qdrant, pgvector). Os axentes poden atopar rapidamente casos similares do pasado, documentos de referencia, políticas da empresa.

Anonimización de datos (Anoxy)

Antes de enviar contidos a modelos LLM externos, o microservizo dedicado Anoxy escanea e anonimiza os datos persoais. Cumprimento de RXPD sen concesións funcionais.

Rexistro de auditoría

Cada interacción entre axentes queda rexistrada: quen, a quen, que preguntou, que resposta obtivo, que modelos LLM se usaron, cal foi o custo. Observabilidade total.

Monitorización e control de custos

Límites por axente, por usuario, por organización. Panel con custos en tempo real. Alertas ante incrementos atípicos de consumo. Optimización do roteamento baseada en datos.

Escalado a humano

Confidence score baixo, decisión financeira ou legal crítica, caso atípico → escalado automático a operador humano con todo o contexto.

Aplicacións na empresa

Seis áreas nas que os sistemas multiaxente de IA entregan valor de negocio medible. Cada unha desprégase como piloto de 4-8 semanas.

Asistente do CEO

Clasifica e responde correos, concerta reunións, prepara briefs antes das conversas, resume documentos longos, monitoriza prazos. Tipicamente aforra ao CEO 10-15 horas semanais de administración.

Compliance e monitorización legal

Monitorización constante dos cambios na lei, clasificación do impacto na empresa, alertas ante novas obrigas. Xeración de informes preliminares de RXPD, EU AI Act, ISO 27001. Borradores de políticas e procedementos.

Desenvolvemento de software

Revisión de código, xeración de probas, escritura de documentación, refactorización, xeración de migracións de base de datos. Dúas ou tres persoas con axentes entregan o valor dun equipo de 8-10 persoas.

Atención ao cliente

Clasificación de tickets, respostas automáticas a preguntas repetitivas (baseadas na base de coñecemento), escalado a humano en casos complexos. Redución do tempo de resposta de horas a minutos.

Análise de documentos

Extracción de datos de contratos, facturas, ofertas. Comparación de condicións comerciais. Detección de inconsistencias e riscos. Xeración de resumos e informes para o equipo legal.

Vendas e marketing

Monitorización de redes sociais e mencións da marca, clasificación do sentimento, xeración de respostas (revisadas por humanos antes da publicación), creación de contidos preliminares de marketing.

Chatbot vs. sistema multiaxente

Aspecto	Chatbot único (ChatGPT/Copilot)	Sistema multiaxente
Especialización	Modelo xeral, „sabe un pouco de todo"	Axentes especializados por dominio
Acceso a datos da empresa	Limitado (copia á xanela de chat)	Nativo (integración con CRM, ERP, bases)
Memoria	Sesión de chat (tipicamente 1-2 h)	Memoria episódica + semántica (persistente)
Roteamento de custos	Un modelo para todas as tarefas	Multinivel (local → nube → premium)
Execución de accións	Xera texto, non executa accións	Chama APIs, escribe en bases, envía correos
Rexistro de auditoría	Inexistente (ou residual)	Completo — cada interacción rexistrada
Anonimización de PII	Depende do usuario	Forzada, automática (Anoxy)
Compliance (RXPD, EU AI Act)	Difícil de probar	Integrada na arquitectura

Plataforma de referencia: HybridCrew

HybridCrew é a plataforma interna de ESKOM AI que utilizamos para prestar servizos aos clientes. Orquestra decenas de axentes IA especializados — cada un co seu propio rol (p. ex. asistente de organización, controller financeiro, project manager, backend developer, security reviewer), interface en polaco, acceso a ferramentas e integracións con sistemas de negocio.

Características técnicas clave:

Roteamento multinivel de LLM — desde modelos locais gratuítos (Ollama) ata os modelos en nube máis potentes. Selección de modelo automática, segundo a complexidade da tarefa.
Amplas integracións — Gmail, Slack, Jira, Confluence, Microsoft Graph, Salesforce, Airtable e moitas outras. Podemos conectar calquera API do cliente.
Email Intelligence — clasificación automática do correo do CEO, recoñecemento de intencións, xeración de respostas para aprobación.
Anoxy — anonimización de PII — microservizo dedicado que anonimiza os datos persoais antes de envialos a modelos externos. Cumprimento de RXPD sen concesións.
Memoria episódica e semántica — os axentes aprenden das experiencias, poden recorrer ao coñecemento de dominio nunha base vectorial.
Monitorización de custos — panel con custos en tempo real por axente, por usuario, por organización. Límites e alertas ante incrementos atípicos.
Cumprimento de EU AI Act — sistema clasificado como IA de risco limitado, con todas as obrigas de transparencia (Art. 50): banner que informa sobre a IA, marcado dos contidos xerados, metadatos de exportación.

Preguntas máis frecuentes

Que é un sistema multiaxente?

Un sistema multiaxente de IA é unha arquitectura na que varios ou decenas de axentes IA especializados colaboran para resolver tarefas. Cada axente ten o seu rol (p. ex. asistente do CEO, controller financeiro, security reviewer, backend developer), as súas propias ferramentas (API, acceso a bases de datos, internet), memoria (episódica — o que fixo antes, semántica — coñecemento de dominio) e estratexia de acción. No canto dun único chatbot xeral, a empresa recibe un equipo de IA cun reparto claro de responsabilidades.

En que se diferencia isto dun chatbot único do estilo de ChatGPT?

Un chatbot único maneja moi ben tarefas textuais simples, pero cando a tarefa esixe: acceso a bases de datos da empresa, integración con sistemas de negocio (CRM, ERP, correo), execución de pasos en secuencia, memoria das interaccións previas, verificación de calidade — o chatbot deixa de ser suficiente. O sistema multiaxente resólveo mediante especialización (o axente financeiro coñece a contabilidade, o axente legal coñece a RXPD), colaboración (os axentes saben consultarse entre si) e orquestración (mecanismo de selección de quen recibe cada tarefa).

Que tarefas se poden delegar nun sistema multiaxente?

Na práctica: xestión de calendario e correo do CEO, clasificación e resposta a correos de clientes, monitorización de cambios legais, preparación de informes financeiros, revisión de pull requests, xeración de documentación, automatización do onboarding de empregados, atención de tickets de soporte, análise de documentos (contratos, facturas, ofertas), monitorización de redes sociais e mencións da marca, xeración de contidos de marketing. Canto máis repetitivas e procedimentadas — mellor se adaptan á automatización.

Son caros de manter os sistemas multiaxente?

Depende da arquitectura de custos. Se cada axente usa o modelo LLM máis potente para cada tarefa, o custo mensual sobe rapidamente. Por iso aplicamos roteamento multinivel de modelos LLM: as tarefas pequenas van a modelos locais (Ollama na GPU da infraestrutura do cliente — custo operativo próximo a 0), as tarefas medias a modelos en nube máis baratos, só as decisións máis complexas aos modelos máis potentes. Grazas a isto un cliente típico paga unha fracción do que pagaría usando uniformemente os modelos máis potentes.

Como se comunican os axentes entre si?

Dúas rutas principais: sincrónica (o axente A fai unha pregunta ao axente B e agarda a resposta) e asincrónica (o axente A bota unha tarefa nunha cola, o axente B procésaa ao seu ritmo, o axente A recibe notificación do resultado). A plataforma central de orquestración xestiona o roteamento, garda o historial da conversa (rexistro de auditoría), controla os custos (límites de tokens por axente, por usuario). Toda a comunicación queda rexistrada — pódese reproducir calquera interacción entre axentes e comprobar como se chegou a unha decisión concreta.

Que pasa coa seguridade dos datos nun sistema multiaxente?

Tres capas de protección. Primeira: anonimización de PII (datos persoais, números de conta, identificadores fiscais, enderezos) antes de envialos a modelos LLM externos — usamos para isto o microservizo Anoxy, que escanea o contido antes do envío. Segunda: illamento dos axentes — cada axente ten os permisos mínimos (least privilege), non ve datos fóra do seu dominio. Terceira: opción de funcionar na infraestrutura do cliente — os modelos LLM poden executarse localmente (Ollama na GPU), sen que os datos saian da rede do cliente. Cumprimento de RXPD e das directrices do EU AI Act.

Poden os axentes cometer erros? Que facemos entón?

Si, calquera modelo LLM pode alucinar, cometer erros de lóxica ou interpretar mal o contexto. Estratexias de minimización: 1) validación dos resultados (p. ex. o axente financeiro debe devolver números nun formato concreto, un validador comproba a conformidade); 2) double-checking para decisións críticas (un segundo axente verifica independentemente o resultado do primeiro); 3) escalado a humano (con confidence score baixo ou caso atípico); 4) rexistro de auditoría (cada decisión queda rexistrada — pódese desfacer, analizar, mellorar o prompt). As decisións financeiras e legais críticas nunca son autónomas — requiren aprobación humana.

Como é o despregamento dun sistema multiaxente nunha empresa?

Tipicamente catro fases. 1) Discovery (2-4 semanas): identificación de procesos para automatizar, avaliación do ROI de cada un, selección de 2-3 piloto. 2) Piloto (4-8 semanas): despregamento dos primeiros axentes para os procesos escollidos, medición do impacto, axuste. 3) Escalado (3-6 meses): expansión a procesos e departamentos adicionais, integración con sistemas existentes. 4) Optimización (continua): mellora dos axentes a partir de datos de produción, incorporación de novos roles, integracións con novos sistemas, perfeccionamento do compliance, redución de custos dos modelos LLM. A IA convértese nunha parte integral das operacións da empresa.

Substituirá o sistema multiaxente aos empregados?

Substituirá tarefas concretas, pero non persoas. Efecto máis frecuente: os empregados recuperan tempo (tipicamente o 30-50% nos departamentos administrativos), que poden dedicar a tarefas que requiren xuízo humano, creatividade, construción de relacións. As empresas non despiden — máis ben crecen máis rápido (máis proxectos atendidos polo mesmo equipo). Excepción: tarefas repetitivas de baixo valor (p. ex. copia manual de datos entre sistemas) — estas desaparecen e ninguén as bota de menos.

Que tecnoloxías hai detrás dos sistemas multiaxente?

Frameworks máis frecuentes: Microsoft AutoGen, CrewAI, LangGraph, Haystack Agents. Modelos LLM: Anthropic Claude, OpenAI GPT, modelos locais Llama, Mistral, o polaco Bielik. Bases vectoriais para memoria semántica: Qdrant, Weaviate, pgvector. Colas de mensaxes para asíncrono: Redis, RabbitMQ, Kafka. Monitorización: Prometheus + Grafana, Sentry, OpenTelemetry. En ESKOM AI combinamos todo isto nunha plataforma interna (HybridCrew) con observabilidade total, control de custos e compliance.

Primeiro piloto en 4-8 semanas

Escollemos 2-3 procesos de negocio con maior potencial de ROI e despregamos axentes piloto. Medimos o impacto, axustamos e decidimos sobre o escalado.

Reserva conversa sobre piloto Desenvolvemento con IA