Pillar page
Vývoj software s AI
Ověřený proces automatizace vývoje software s týmem AI agentů — od analýzy požadavků, přes kódování a vícevrstvé testování (unit, integrační, E2E, security, performance) až po produkční nasazení s kompletním audit trailem.
Provozujeme tým specializovaných AI agentů, který se účastní každé fáze životního cyklu vývoje software — od analýzy požadavků, přes návrh architektury, kódování a vícevrstvé testování až po code review, dokumentaci a nasazení s kompletním audit trailem.
Tímto způsobem vyvíjíme vlastní produkty ESKOM AI — multi-agentní platformu HybridCrew, systém pro Compliance audity, mikroslužbu KRS+CRBR a portfolio integrací. Stejný proces uplatňujeme v klientských projektech: jak při tvorbě nových mikroslužeb, tak při modernizaci legacy systémů.
Tento článek popisuje, jak to funguje v praxi: jaké úkoly přebírají agenti, které zůstávají na straně člověka, jaké testy spouštíme a proč je tento proces opakovatelný napříč typy projektů.
Proč automatizovat vývoj software?
Klasický cyklus vývoje software (analýza → kód → testy → review → nasazení) ve zralém týmu typicky zabere 2-4 týdny na feature střední velikosti. Většina tohoto času připadá na opakované úkoly: psaní boilerplate, generování jednotkových testů, recenzování změn, aktualizace dokumentace, generování databázových migrací. Všechny jsou vhodné k automatizaci.
Cíl našeho procesu je jednoduchý: dva nebo tři lidé pracující s AI agenty dodávají hodnotu týmu o velikosti 8-10 osob — bez vyhoření, s vyšší kvalitou (více testů, lepší code review, kompletní dokumentace) a kratším time-to-market.
Tohle není „AI nahradí programátory". Tohle je „programátoři s AI nahradí programátory bez AI". Zkušení inženýři zůstávají nezbytní — navrhují architekturu, dělají strategická rozhodnutí, recenzují složité změny. AI agenti přebírají rutinu.
Šestietapový proces
Pipeline od požadavků k produkci. Každou fázi provádějí specializovaní AI agenti a člověk dohlíží a schvaluje klíčová rozhodnutí.
Analýza požadavků a architektura
AI agenti analyzují obchodní dokumentaci, rozhovory se zákazníkem (z transkripcí) a stávající kód. Navrhují mikroservisní architekturu, schéma databáze, seznam endpointů a model oprávnění. Člověk (CTO/architekt) propozici recenzuje a schvaluje před zahájením kódování.
Psaní kódu (TDD)
Nejprve testy, pak implementace. Backend agent píše API ve FastAPI/Express, frontend agent komponenty React. Každá změna = samostatný pull request s čistou commit zprávou. Standardy kódování (Black, ESLint, Prettier) jsou vynucovány automaticky.
Vícevrstvé testování
Unit (pytest, Jest), integrační (testcontainers s reálným PostgreSQL), E2E (Playwright), UI snapshot, security (OWASP, gitleaks, bandit), performance (k6/locust), accessibility (axe). Každý PR spouští celý pipeline — selhávající test blokuje merge.
Code review pomocí AI
Agent SecurityReviewer skenuje pod úhlem OWASP Top 10, agent QualityReviewer kontroluje čitelnost a vzory, agent ArchitectureReviewer ověřuje konzistenci se zbytkem systému. Hraniční případy eskalují k člověku.
Dokumentace a CHANGELOG
Každá změna logiky = bump verze + záznam v CHANGELOG.md ve formátu Keep a Changelog. Dokumentace API (OpenAPI/Swagger) se generuje automaticky. CLAUDE.md je aktualizován po každé session s novými lekcemi.
Nasazení s Change Request
Nasazení vždy přes Git (NIKDY přímý scp). Nejprve testovací prostředí s Playwright ověřením, pak teprve produkce po schválení CR. Deploy skript obsahuje plán rollback (<5 min) a health checks.
Co firma získává?
Tisíce automatizovaných testů
Každý produkční projekt má od několika tisíc až po desítky tisíc testů — unit, integrační, E2E, security, performance. Regrese jsou zachyceny v CI dříve, než se dostanou k uživateli.
Kompletní audit trail
Každá změna v kódu, databázi nebo konfiguraci je zaznamenána: Git, audit log v databázi, CHANGELOG, Change Request. Splňuje požadavky ISO 27001, EU AI Act a GDPR.
Škálovatelnost týmu
Dva nebo tři lidé s AI agenty dodávají hodnotu týmu o velikosti 8-10 osob. Bez vyhoření, s vyšší kvalitou a kratšími timeline.
Eskalace k silnějším modelům
LLM routing volí správný model pro každý úkol: drobné změny — lokální Ollama (nulové náklady), složitá architektura — Claude Opus. Optimalizace nákladů a kvality v jednom.
Opakovatelnost a standardy
Každý projekt používá stejné standardy: feature branch workflow, squash merge, Conventional Commits, CHANGELOG, EU AI Act, GDPR. Nový vývojář rozumí struktuře za jeden den.
Bezpečnost by default
Gitleaks při pre-commit + CI, tajemství v HashiCorp Vault, privátní repozitáře, Keycloak SSO, Tailscale VPN pro interní služby. Žádné kompromisy oproti rychlosti.
Vícevrstvé testování — základ kvality
Každá změna v produkčním kódu prochází kompletním pipeline testů. Bez výjimek — i oprava překlepu v komentáři spouští CI, protože test pipeline je vynucen Git hookem, ne politickým rozhodnutím vývojáře.
- Jednotkové testy (unit): pytest, Jest, vitest. Pokrývají jednotlivé funkce a třídy. Pokrytí >80 % pro kritický kód.
- Integrační testy: testcontainers s reálnými instancemi PostgreSQL, Redis, Vault. Mocky pouze pro externí API třetích stran.
- End-to-end (E2E) testy: Playwright ve Firefoxu (výchozí), Chrome (volitelně). Simulují kompletní uživatelské cesty: login → akce → ověření.
- UI testy (snapshot, accessibility): Playwright + axe-core. WCAG 2.0 AA jako baseline, Lighthouse 100/100/100/100 jako cíl.
- Security testy: OWASP Top 10 (semgrep, bandit, eslint-plugin-security), gitleaks (skenování tajemství při pre-commit a CI), trivy (skenování Docker obrazů).
- Výkonnostní testy: k6 nebo locust pro load testy, kontrola p95/p99 doby odezvy pod zátěží.
- Regresní testy: celá sada se spouští před každým produkčním nasazením. Každý hlášený bug se stává regresním testem.
- Smoke testy: minimální sada 5-10 testů spuštěných po produkčním nasazení (zda aplikace vůbec naběhla).
- Akceptační testy: obchodní testy (Cucumber/Gherkin) potvrzující, že požadavek byl splněn.
Selhávající test = zablokovaný merge. Bez výjimek. Pokud je test „flaky" (nestabilní), diagnostický agent analyzuje příčinu a opravuje test nebo kód, ale nikdy neodstraňuje test bez rozhodnutí člověka.
Typické případy použití
Vzory, které uplatňujeme nejčastěji. Každý má vlastní sadu agentů, nástrojů a šablon. Time-to-value se měří v týdnech, ne v měsících.
Modernizace legacy systému
- •Stará monolitická aplikace (PHP/.NET, bez testů, obtížná na údržbu)
- •Agenti rozkládají monolit na mikroslužby (inkrementální proces, bez výpadku)
- •Generují charakterizační testy (zachycení současného chování) před refaktoringem
- •Migrace dat s kompletním audit trailem a plánem rollback
Nová enterprise mikroslužba
- •Specifikace na vstupu (Jira ticket, PRD dokument, transkripce schůzky)
- •Architektura → kód → testy → review → nasazení za 2-3 týdny
- •Integrace se stávajícím SSO (Keycloak), audit logem, monitoringem
- •Plná shoda s EU AI Act a GDPR od první řádky kódu
Integrace systémů
- •Propojení ERP, CRM, KRS, Microsoft Graph, IBM, Cisco, externí partneři
- •Agenti píší adaptéry, mapování, retry/backoff, idempotenci
- •Integrační testy na reálných endpointech (sandbox API)
- •Monitoring (Prometheus + Grafana) a alerty (Sentry) zapojené automaticky
Multi-tenant platformy
- •Multi-klientské SaaS s plnou izolací dat (per-tenant schéma nebo row-level security)
- •Automatizovaný onboarding klienta (Keycloak provisioning, databáze, role)
- •Billing založený na SSO Billing SDK (sledování spotřeby tokenů, fail-open)
- •Compliance: GDPR, ISO 27001, EU AI Act připraveno k auditu
Srovnání: klasický tým vs. AI-řízený proces
| Aspekt | Klasický tým (8-10 osob) | Tým s AI agenty (2-3 osoby) |
|---|---|---|
| Time-to-market (průměrný feature) | 2-4 týdny | 3-7 dní |
| Pokrytí testy | 40-60 % (když má tým čas) | >80 % defaultně (testy generované spolu s kódem) |
| Code review | 1 osoba, průměrně 30-60 min | 3 agenti (security, quality, architecture) + člověk u složitých změn |
| Dokumentace | Často neúplná, „dodělávaná" | Generovaná spolu s kódem (OpenAPI, README, CHANGELOG) |
| Audit trail | Git history | Git + audit log v databázi + CHANGELOG + Change Request |
| Škálování | Lineární (více lidí = vyšší komunikační náklady) | Nelineární (více agentů = stejný počet dohlížejících osob) |
| Compliance (EU AI Act, GDPR, ISO 27001) | Často externí audit po faktu | Zabudované v procesu od první řádky kódu |
Často kladené otázky
Co je automatizovaný vývoj software s AI?
Čím se to liší od klasického programování s Copilotem?
Jaké typy testů tento proces spouští?
Nasazuje AI kód do produkce sama?
Funguje tento proces pro enterprise projekty?
Jak dlouho trvá zavedení tohoto procesu v naší firmě?
Co se zabezpečením zdrojového kódu?
Nahradíte náš vývojový tým?
Kolik vývoj software s AI stojí?
Jaké jsou typické signály, že je firma na tento proces připravena?
Připraveni na pilotní projekt?
Začínáme auditem stávajícího procesu a pilotem na vybrané mikroslužbě. První výsledky viditelné za 2-4 týdny. Bez závazku na víceleté kontrakty.