Pillar page
Desenvolupament de programari amb IA
Un procés provat per automatitzar el desenvolupament de programari amb un equip d'agents d'IA — des de l'anàlisi de requisits, passant per la codificació i les proves multicapa (unit, integració, E2E, seguretat, rendiment), fins al desplegament a producció amb un rastre d'auditoria complet.
Disposem d'un equip d'agents d'IA especialitzats que participa en cada etapa del cicle de vida del desenvolupament de programari — des de l'anàlisi de requisits, passant pel disseny d'arquitectura, la codificació i les proves multicapa, fins a la revisió de codi, la documentació i el desplegament amb un rastre d'auditoria complet.
Així construïm els nostres propis productes d'ESKOM AI — la plataforma multiagent HybridCrew, el sistema d'auditories de Compliance, el microservei KRS+CRBR i una desena d'integracions. Apliquem el mateix procés en els projectes per a clients: tant en la construcció de microserveis nous com en la modernització de sistemes llegats.
Aquest article descriu com funciona a la pràctica: quines tasques assumeixen els agents, quines romanen al costat humà, quines proves executem i per què aquest procés és repetible.
Per què automatitzar el desenvolupament?
El cicle clàssic de desenvolupament de programari (anàlisi → codi → proves → revisió → desplegament) en un equip madur acostuma a durar 2-4 setmanes per a una funcionalitat de mida mitjana. La major part d'aquest temps són tasques repetitives: escriure boilerplate, generar proves unitàries, revisar canvis, actualitzar documentació, generar migracions de base de dades. Totes elles propenses a l'automatització.
L'objectiu del nostre procés és senzill: dues o tres persones amb agents d'IA aporten el valor que abans donava un equip de 8-10 persones — sense esgotament, amb millor qualitat (més proves, millor revisió de codi, documentació completa) i un time-to-market més curt.
Això no és «la IA reemplaçarà els programadors». És «els programadors amb IA reemplaçaran els programadors sense IA». Els enginyers experimentats continuen sent imprescindibles — dissenyen l'arquitectura, prenen decisions estratègiques, revisen canvis complexos. Els agents s'encarreguen de la rutina.
Sis etapes del procés
El pipeline des dels requisits fins a producció. Cada etapa l'executen agents d'IA especialitzats, mentre que un humà supervisa i aprova les decisions clau.
Anàlisi de requisits i arquitectura
Els agents d'IA analitzen la documentació de negoci, les converses amb el client (a partir de transcripcions) i el codi existent. Proposen una arquitectura de microserveis, l'esquema de base de dades, la llista d'endpoints i el model de permisos. Un humà (CTO/arquitecte) revisa i aprova la proposta abans de començar a codificar.
Escriure codi (TDD)
Primer les proves, després la implementació. Un agent de backend escriu API en FastAPI/Express, un agent de frontend escriu components React. Cada canvi és una pull request independent amb un commit clar. Els estàndards de codificació (Black, ESLint, Prettier) s'apliquen automàticament.
Proves multicapa
Unit (pytest, Jest), integració (testcontainers amb un PostgreSQL real), E2E (Playwright), snapshot d'UI, seguretat (OWASP, gitleaks, bandit), rendiment (k6/locust), accessibilitat (axe). Cada PR executa el pipeline complet — una prova vermella bloqueja el merge.
Revisió de codi per IA
Un agent SecurityReviewer escaneja contra l'OWASP Top 10, un agent QualityReviewer comprova la llegibilitat i els patrons, un agent ArchitectureReviewer verifica la coherència amb la resta del sistema. Els casos dubtosos s'escalen a l'humà.
Documentació i CHANGELOG
Cada canvi de lògica = bump de versió + entrada a CHANGELOG.md en format Keep a Changelog. La documentació de l'API (OpenAPI/Swagger) es genera automàticament. CLAUDE.md s'actualitza després de cada sessió amb noves lliçons apreses.
Desplegament amb Change Request
El desplegament sempre passa per Git (MAI scp directe). Primer l'entorn de test, verificació amb Playwright, només després la producció amb el CR aprovat. L'script de desplegament inclou un pla de rollback (<5 min) i health checks.
Què hi guanya l'empresa?
Milers de proves automàtiques
Cada projecte de producció té entre diversos milers i desenes de milers de proves — unit, integració, E2E, seguretat, rendiment. Les regressions es detecten a la CI abans d'arribar a l'usuari.
Rastre d'auditoria complet
Cada canvi en codi, base de dades o configuració queda registrat: Git, audit log a la base de dades, CHANGELOG, Change Request. Compleix els requisits d'ISO 27001, EU AI Act i RGPD.
Escalabilitat de l'equip
Dues o tres persones amb agents d'IA aporten el valor que abans donava un equip de 8-10 persones. Sense esgotament, amb millor qualitat i terminis més curts.
Escalada a models més potents
El routing LLM tria el model adequat per a cada tasca: canvis menors — Ollama local (cost $0), arquitectura complexa — Claude Opus. Optimització de cost i qualitat en un sol procés.
Repetibilitat i estàndards
Cada projecte aplica els mateixos estàndards: feature branch workflow, squash merge, Conventional Commits, CHANGELOG, EU AI Act, RGPD. Un desenvolupador nou entén l'estructura en un dia.
Seguretat per defecte
Gitleaks a pre-commit + CI, secrets a HashiCorp Vault, repositoris privats, SSO Keycloak, Tailscale VPN per als serveis interns. Cap concessió a canvi de velocitat.
Proves multicapa — el fonament de la qualitat
Cada canvi en el codi de producció passa per un pipeline complet de proves. Sense excepcions — fins i tot corregir una errada tipogràfica en un comentari activa la CI, perquè el pipeline de proves està integrat en un Git hook, no és una decisió política del desenvolupador.
- Proves unitàries (unit): pytest, Jest, vitest. Comproven funcions i classes individuals. Cobertura >80% per al codi crític.
- Proves d'integració: testcontainers amb instàncies reals de PostgreSQL, Redis i Vault. Mocks només per a API externes de tercers.
- Proves E2E (end-to-end): Playwright a Firefox (per defecte), Chrome (opcional). Simulen rutes completes d'usuari: login → acció → verificació.
- Proves d'UI (snapshot, accessibilitat): Playwright + axe-core. WCAG 2.0 AA com a línia base, Lighthouse 100/100/100/100 com a objectiu.
- Proves de seguretat: OWASP Top 10 (semgrep, bandit, eslint-plugin-security), gitleaks (escaneig de secrets a pre-commit i CI), trivy (escaneig d'imatges Docker).
- Proves de rendiment: k6 o locust per a proves de càrrega, comprovant els temps de resposta p95/p99 sota pressió.
- Proves de regressió: la suite completa s'executa abans de cada desplegament a producció. Cada bug reportat es converteix en una prova de regressió.
- Proves de smoke: un conjunt mínim de 5-10 proves executades després del desplegament a producció (si l'aplicació ha arrencat).
- Proves d'acceptació: proves de negoci (Cucumber/Gherkin) que confirmen que el requisit s'ha complert.
Una prova vermella = merge bloquejat. Sense excepcions. Si una prova és «flaky» (inestable), un agent de diagnòstic analitza la causa arrel i corregeix la prova o el codi, però mai elimina la prova sense una decisió humana.
Casos d'ús habituals
Els patrons que apliquem amb més freqüència. Cadascun té el seu propi conjunt d'agents, eines i plantilles. El time-to-value es mesura en setmanes, no en mesos.
Modernització de sistemes llegats
- •Aplicació monolítica antiga (PHP/.NET, sense proves, difícil de mantenir)
- •Els agents descomponen el monòlit en microserveis (procés incremental, sense aturades)
- •Generen proves de caracterització (capturen el comportament actual) abans de la refactorització
- •Migració de dades amb rastre d'auditoria complet i pla de rollback
Nou microservei enterprise
- •Especificació d'entrada (ticket de Jira, document PRD, transcripció de reunió)
- •Arquitectura → codi → proves → revisió → desplegament en 2-3 setmanes
- •Integració amb SSO existent (Keycloak), audit log i monitoratge
- •Conformitat total amb EU AI Act i RGPD des de la primera línia de codi
Integració de sistemes
- •Connexió d'ERP, CRM, KRS, Microsoft Graph, IBM, Cisco i socis externs
- •Els agents escriuen adaptadors, mappings, retry/backoff i idempotència
- •Proves d'integració contra endpoints reals (API sandbox)
- •Monitoratge (Prometheus + Grafana) i alertes (Sentry) connectats automàticament
Plataformes multi-tenant
- •SaaS multi-client amb aïllament total de dades (esquema per tenant o row-level security)
- •Onboarding de client automatitzat (provisioning de Keycloak, base de dades, rols)
- •Billing basat en SSO Billing SDK (token usage tracking, fail-open)
- •Compliance: RGPD, ISO 27001, EU AI Act llestos per a auditoria
Comparativa: equip clàssic vs. procés amb IA
| Aspecte | Equip clàssic (8-10 persones) | Equip amb agents d'IA (2-3 persones) |
|---|---|---|
| Time-to-market (funcionalitat mitjana) | 2-4 setmanes | 3-7 dies |
| Cobertura de proves | 40-60% (si l'equip té temps) | >80% per defecte (proves generades amb el codi) |
| Revisió de codi | 1 persona, 30-60 min de mitjana | 3 agents (seguretat, qualitat, arquitectura) + humà en canvis complexos |
| Documentació | Sovint incompleta, «afegida després» | Generada amb el codi (OpenAPI, README, CHANGELOG) |
| Rastre d'auditoria | Historial de Git | Git + audit log a base de dades + CHANGELOG + Change Request |
| Escalat | Lineal (més persones = més cost de comunicació) | No lineal (més agents = el mateix nombre de persones supervisant) |
| Compliance (EU AI Act, RGPD, ISO 27001) | Sovint auditoria externa a posteriori | Integrat al procés des de la primera línia de codi |
Preguntes freqüents
Què és el desenvolupament automatitzat de programari amb IA?
En què es diferencia aquest procés de programar amb Copilot?
Quins tipus de proves executa aquest procés?
La IA desplega codi a producció pel seu compte?
Aquest procés funciona per a projectes enterprise?
Quant temps triga implementar aquest procés a la nostra empresa?
Què passa amb la seguretat del codi font?
Substituireu el nostre equip de desenvolupament?
Quant costa el desenvolupament de programari amb IA?
Quins són els senyals típics que una empresa està preparada per a aquest procés?
Preparats per a un pilot?
Comencem amb una auditoria del procés existent i un pilot sobre un microservei seleccionat. Primers resultats visibles en 2-4 setmanes. Sense compromisos plurianuals.