Pillar page

Desenvolupament de programari amb IA

Un procés provat per automatitzar el desenvolupament de programari amb un equip d'agents d'IA — des de l'anàlisi de requisits, passant per la codificació i les proves multicapa (unit, integració, E2E, seguretat, rendiment), fins al desplegament a producció amb un rastre d'auditoria complet.

Disposem d'un equip d'agents d'IA especialitzats que participa en cada etapa del cicle de vida del desenvolupament de programari — des de l'anàlisi de requisits, passant pel disseny d'arquitectura, la codificació i les proves multicapa, fins a la revisió de codi, la documentació i el desplegament amb un rastre d'auditoria complet.

Així construïm els nostres propis productes d'ESKOM AI — la plataforma multiagent HybridCrew, el sistema d'auditories de Compliance, el microservei KRS+CRBR i una desena d'integracions. Apliquem el mateix procés en els projectes per a clients: tant en la construcció de microserveis nous com en la modernització de sistemes llegats.

Aquest article descriu com funciona a la pràctica: quines tasques assumeixen els agents, quines romanen al costat humà, quines proves executem i per què aquest procés és repetible.

Per què automatitzar el desenvolupament?

El cicle clàssic de desenvolupament de programari (anàlisi → codi → proves → revisió → desplegament) en un equip madur acostuma a durar 2-4 setmanes per a una funcionalitat de mida mitjana. La major part d'aquest temps són tasques repetitives: escriure boilerplate, generar proves unitàries, revisar canvis, actualitzar documentació, generar migracions de base de dades. Totes elles propenses a l'automatització.

L'objectiu del nostre procés és senzill: dues o tres persones amb agents d'IA aporten el valor que abans donava un equip de 8-10 persones — sense esgotament, amb millor qualitat (més proves, millor revisió de codi, documentació completa) i un time-to-market més curt.

Això no és «la IA reemplaçarà els programadors». És «els programadors amb IA reemplaçaran els programadors sense IA». Els enginyers experimentats continuen sent imprescindibles — dissenyen l'arquitectura, prenen decisions estratègiques, revisen canvis complexos. Els agents s'encarreguen de la rutina.

Sis etapes del procés

El pipeline des dels requisits fins a producció. Cada etapa l'executen agents d'IA especialitzats, mentre que un humà supervisa i aprova les decisions clau.

1

Anàlisi de requisits i arquitectura

Els agents d'IA analitzen la documentació de negoci, les converses amb el client (a partir de transcripcions) i el codi existent. Proposen una arquitectura de microserveis, l'esquema de base de dades, la llista d'endpoints i el model de permisos. Un humà (CTO/arquitecte) revisa i aprova la proposta abans de començar a codificar.

2

Escriure codi (TDD)

Primer les proves, després la implementació. Un agent de backend escriu API en FastAPI/Express, un agent de frontend escriu components React. Cada canvi és una pull request independent amb un commit clar. Els estàndards de codificació (Black, ESLint, Prettier) s'apliquen automàticament.

3

Proves multicapa

Unit (pytest, Jest), integració (testcontainers amb un PostgreSQL real), E2E (Playwright), snapshot d'UI, seguretat (OWASP, gitleaks, bandit), rendiment (k6/locust), accessibilitat (axe). Cada PR executa el pipeline complet — una prova vermella bloqueja el merge.

4

Revisió de codi per IA

Un agent SecurityReviewer escaneja contra l'OWASP Top 10, un agent QualityReviewer comprova la llegibilitat i els patrons, un agent ArchitectureReviewer verifica la coherència amb la resta del sistema. Els casos dubtosos s'escalen a l'humà.

5

Documentació i CHANGELOG

Cada canvi de lògica = bump de versió + entrada a CHANGELOG.md en format Keep a Changelog. La documentació de l'API (OpenAPI/Swagger) es genera automàticament. CLAUDE.md s'actualitza després de cada sessió amb noves lliçons apreses.

6

Desplegament amb Change Request

El desplegament sempre passa per Git (MAI scp directe). Primer l'entorn de test, verificació amb Playwright, només després la producció amb el CR aprovat. L'script de desplegament inclou un pla de rollback (<5 min) i health checks.

Què hi guanya l'empresa?

Milers de proves automàtiques

Cada projecte de producció té entre diversos milers i desenes de milers de proves — unit, integració, E2E, seguretat, rendiment. Les regressions es detecten a la CI abans d'arribar a l'usuari.

Rastre d'auditoria complet

Cada canvi en codi, base de dades o configuració queda registrat: Git, audit log a la base de dades, CHANGELOG, Change Request. Compleix els requisits d'ISO 27001, EU AI Act i RGPD.

Escalabilitat de l'equip

Dues o tres persones amb agents d'IA aporten el valor que abans donava un equip de 8-10 persones. Sense esgotament, amb millor qualitat i terminis més curts.

Escalada a models més potents

El routing LLM tria el model adequat per a cada tasca: canvis menors — Ollama local (cost $0), arquitectura complexa — Claude Opus. Optimització de cost i qualitat en un sol procés.

Repetibilitat i estàndards

Cada projecte aplica els mateixos estàndards: feature branch workflow, squash merge, Conventional Commits, CHANGELOG, EU AI Act, RGPD. Un desenvolupador nou entén l'estructura en un dia.

Seguretat per defecte

Gitleaks a pre-commit + CI, secrets a HashiCorp Vault, repositoris privats, SSO Keycloak, Tailscale VPN per als serveis interns. Cap concessió a canvi de velocitat.

Proves multicapa — el fonament de la qualitat

Cada canvi en el codi de producció passa per un pipeline complet de proves. Sense excepcions — fins i tot corregir una errada tipogràfica en un comentari activa la CI, perquè el pipeline de proves està integrat en un Git hook, no és una decisió política del desenvolupador.

  • Proves unitàries (unit): pytest, Jest, vitest. Comproven funcions i classes individuals. Cobertura >80% per al codi crític.
  • Proves d'integració: testcontainers amb instàncies reals de PostgreSQL, Redis i Vault. Mocks només per a API externes de tercers.
  • Proves E2E (end-to-end): Playwright a Firefox (per defecte), Chrome (opcional). Simulen rutes completes d'usuari: login → acció → verificació.
  • Proves d'UI (snapshot, accessibilitat): Playwright + axe-core. WCAG 2.0 AA com a línia base, Lighthouse 100/100/100/100 com a objectiu.
  • Proves de seguretat: OWASP Top 10 (semgrep, bandit, eslint-plugin-security), gitleaks (escaneig de secrets a pre-commit i CI), trivy (escaneig d'imatges Docker).
  • Proves de rendiment: k6 o locust per a proves de càrrega, comprovant els temps de resposta p95/p99 sota pressió.
  • Proves de regressió: la suite completa s'executa abans de cada desplegament a producció. Cada bug reportat es converteix en una prova de regressió.
  • Proves de smoke: un conjunt mínim de 5-10 proves executades després del desplegament a producció (si l'aplicació ha arrencat).
  • Proves d'acceptació: proves de negoci (Cucumber/Gherkin) que confirmen que el requisit s'ha complert.

Una prova vermella = merge bloquejat. Sense excepcions. Si una prova és «flaky» (inestable), un agent de diagnòstic analitza la causa arrel i corregeix la prova o el codi, però mai elimina la prova sense una decisió humana.

Casos d'ús habituals

Els patrons que apliquem amb més freqüència. Cadascun té el seu propi conjunt d'agents, eines i plantilles. El time-to-value es mesura en setmanes, no en mesos.

Modernització de sistemes llegats

  • Aplicació monolítica antiga (PHP/.NET, sense proves, difícil de mantenir)
  • Els agents descomponen el monòlit en microserveis (procés incremental, sense aturades)
  • Generen proves de caracterització (capturen el comportament actual) abans de la refactorització
  • Migració de dades amb rastre d'auditoria complet i pla de rollback

Nou microservei enterprise

  • Especificació d'entrada (ticket de Jira, document PRD, transcripció de reunió)
  • Arquitectura → codi → proves → revisió → desplegament en 2-3 setmanes
  • Integració amb SSO existent (Keycloak), audit log i monitoratge
  • Conformitat total amb EU AI Act i RGPD des de la primera línia de codi

Integració de sistemes

  • Connexió d'ERP, CRM, KRS, Microsoft Graph, IBM, Cisco i socis externs
  • Els agents escriuen adaptadors, mappings, retry/backoff i idempotència
  • Proves d'integració contra endpoints reals (API sandbox)
  • Monitoratge (Prometheus + Grafana) i alertes (Sentry) connectats automàticament

Plataformes multi-tenant

  • SaaS multi-client amb aïllament total de dades (esquema per tenant o row-level security)
  • Onboarding de client automatitzat (provisioning de Keycloak, base de dades, rols)
  • Billing basat en SSO Billing SDK (token usage tracking, fail-open)
  • Compliance: RGPD, ISO 27001, EU AI Act llestos per a auditoria

Comparativa: equip clàssic vs. procés amb IA

AspecteEquip clàssic (8-10 persones)Equip amb agents d'IA (2-3 persones)
Time-to-market (funcionalitat mitjana)2-4 setmanes3-7 dies
Cobertura de proves40-60% (si l'equip té temps)>80% per defecte (proves generades amb el codi)
Revisió de codi1 persona, 30-60 min de mitjana3 agents (seguretat, qualitat, arquitectura) + humà en canvis complexos
DocumentacióSovint incompleta, «afegida després»Generada amb el codi (OpenAPI, README, CHANGELOG)
Rastre d'auditoriaHistorial de GitGit + audit log a base de dades + CHANGELOG + Change Request
EscalatLineal (més persones = més cost de comunicació)No lineal (més agents = el mateix nombre de persones supervisant)
Compliance (EU AI Act, RGPD, ISO 27001)Sovint auditoria externa a posterioriIntegrat al procés des de la primera línia de codi

Preguntes freqüents

Què és el desenvolupament automatitzat de programari amb IA?
És un procés en què agents d'IA especialitzats participen en cada etapa del cicle de vida del desenvolupament de programari: des de l'anàlisi de requisits, passant pel disseny d'arquitectura, la codificació, les proves automàtiques (unit, integració, E2E, seguretat, rendiment, regressió), fins a la revisió de codi i el desplegament a producció. L'humà continua supervisant el procés i prenent les decisions clau, però les tasques rutinàries (escriure codi, generar proves, refactoring, documentació) les fan agents d'IA mantenint els estàndards de qualitat acordats.
En què es diferencia aquest procés de programar amb Copilot?
Copilot és autocompletat — ajuda a escriure línies individuals de codi. El desenvolupament de programari amb IA és orquestració completa: un agent planifica l'arquitectura, un altre escriu el codi, un tercer escriu les proves, un quart fa code review, un cinquè desplega. Cadascun té la seva especialització, memòria episòdica (aprèn de projectes anteriors), eines i context. Efecte: una escala d'automatització molt superior a la d'un sol Copilot, mantenint els estàndards enterprise (proves, seguretat, rastre d'auditoria).
Quins tipus de proves executa aquest procés?
Tots els tipus de proves que s'apliquen en equips de desenvolupament madurs: proves unitàries (unit), d'integració, end-to-end (E2E), d'UI (Playwright), de seguretat (OWASP Top 10, gitleaks), de rendiment (load), de regressió, de smoke i d'acceptació. Les proves s'escriuen abans o en paral·lel amb el codi (TDD) i cada canvi ha de passar pel pipeline complet.
La IA desplega codi a producció pel seu compte?
No automàticament. Els desplegaments a producció requereixen un Change Request (CR) aprovat i una decisió humana. Els agents d'IA preparen la documentació de canvis, executen les proves de regressió i generen scripts de desplegament amb pla de rollback, però l'arrencada final a producció requereix l'aprovació de l'operador. Aquesta regla és intencionada — minimitza el risc d'efectes imprevistos i preserva un rastre d'auditoria complet.
Aquest procés funciona per a projectes enterprise?
Sí. L'utilitzem en els nostres propis productes, incloent la plataforma multiagent HybridCrew, la plataforma de consultoria amb SSO, microserveis amb PostgreSQL i integracions amb sistemes externs (KRS, MS Graph, IBM, Keycloak). Cada projecte té el seu pipeline CI/CD, els seus entorns dev/test/prod, monitoratge i audit log. El procés escala des d'un sol microservei fins a una plataforma amb múltiples contenidors.
Quant temps triga implementar aquest procés a la nostra empresa?
Depèn del context. Per a un equip petit (1-3 desenvolupadors), la integració amb el repositori existent i el pipeline CI/CD acostuma a durar 2-4 setmanes: auditoria, configuració dels agents, alineació amb els estàndards de codificació, formació. Per a organitzacions més grans, els projectes pilot (un equip, un microservei) duren 6-8 setmanes, seguits d'una expansió gradual a altres equips.
Què passa amb la seguretat del codi font?
Els repositoris del client mai no surten cap a serveis externs sense consentiment explícit. Per defecte, tot el procés (agents d'IA, models LLM, base de dades vectorial, audit log) s'executa a la infraestructura del client o al núvol privat d'ESKOM AI amb aïllament total. Els secrets es gestionen amb HashiCorp Vault, el codi s'escaneja amb gitleaks abans de cada commit i tots els repositoris són privats per defecte.
Substituireu el nostre equip de desenvolupament?
No. Els desenvolupadors experimentats són imprescindibles — dissenyen l'arquitectura, prenen decisions, revisen canvis complexos i resolen problemes atípics. Els agents d'IA assumeixen tasques repetitives i automatitzables: escriure boilerplate, generar proves, documentació, refactoring i code review de primer nivell. Objectiu: dues o tres persones amb IA aporten el valor que abans donava un equip de 8-10 persones — sense esgotament, amb millor qualitat i rastre d'auditoria complet.
Quant costa el desenvolupament de programari amb IA?
El pressupost sempre és individual i depèn de l'escala, el model de facturació (subscripció a la plataforma vs. projecte dedicat), les integracions requerides i si els agents s'executen sobre models LLM locals (Ollama a la GPU del client — menor cost operatiu) o al núvol (Anthropic, OpenAI — més flexibilitat). En els pilots busquem aconseguir el retorn de la inversió durant el primer trimestre des de l'arrencada completa.
Quins són els senyals típics que una empresa està preparada per a aquest procés?
Els millors resultats els obtenen els equips que ja tenen: repositori amb control de versions (Git), estàndards de codificació definits, un pipeline CI/CD bàsic, requisits clarament documentats (Jira/Linear/propi) i cultura de code review. La manca d'algun d'aquests elements no bloqueja la implementació — llavors comencem amb una auditoria i la preparació dels fonaments. Les organitzacions menys madures són les que no tenen control de versions o tenen codi de producció que ningú no prova.

Preparats per a un pilot?

Comencem amb una auditoria del procés existent i un pilot sobre un microservei seleccionat. Primers resultats visibles en 2-4 setmanes. Sense compromisos plurianuals.