Pillar page

Vývoj software s AI

Ověřený proces automatizace vývoje software s týmem AI agentů — od analýzy požadavků, přes kódování a vícevrstvé testování (unit, integrační, E2E, security, performance) až po produkční nasazení s kompletním audit trailem.

Provozujeme tým specializovaných AI agentů, který se účastní každé fáze životního cyklu vývoje software — od analýzy požadavků, přes návrh architektury, kódování a vícevrstvé testování až po code review, dokumentaci a nasazení s kompletním audit trailem.

Tímto způsobem vyvíjíme vlastní produkty ESKOM AI — multi-agentní platformu HybridCrew, systém pro Compliance audity, mikroslužbu KRS+CRBR a portfolio integrací. Stejný proces uplatňujeme v klientských projektech: jak při tvorbě nových mikroslužeb, tak při modernizaci legacy systémů.

Tento článek popisuje, jak to funguje v praxi: jaké úkoly přebírají agenti, které zůstávají na straně člověka, jaké testy spouštíme a proč je tento proces opakovatelný napříč typy projektů.

Proč automatizovat vývoj software?

Klasický cyklus vývoje software (analýza → kód → testy → review → nasazení) ve zralém týmu typicky zabere 2-4 týdny na feature střední velikosti. Většina tohoto času připadá na opakované úkoly: psaní boilerplate, generování jednotkových testů, recenzování změn, aktualizace dokumentace, generování databázových migrací. Všechny jsou vhodné k automatizaci.

Cíl našeho procesu je jednoduchý: dva nebo tři lidé pracující s AI agenty dodávají hodnotu týmu o velikosti 8-10 osob — bez vyhoření, s vyšší kvalitou (více testů, lepší code review, kompletní dokumentace) a kratším time-to-market.

Tohle není „AI nahradí programátory". Tohle je „programátoři s AI nahradí programátory bez AI". Zkušení inženýři zůstávají nezbytní — navrhují architekturu, dělají strategická rozhodnutí, recenzují složité změny. AI agenti přebírají rutinu.

Šestietapový proces

Pipeline od požadavků k produkci. Každou fázi provádějí specializovaní AI agenti a člověk dohlíží a schvaluje klíčová rozhodnutí.

1

Analýza požadavků a architektura

AI agenti analyzují obchodní dokumentaci, rozhovory se zákazníkem (z transkripcí) a stávající kód. Navrhují mikroservisní architekturu, schéma databáze, seznam endpointů a model oprávnění. Člověk (CTO/architekt) propozici recenzuje a schvaluje před zahájením kódování.

2

Psaní kódu (TDD)

Nejprve testy, pak implementace. Backend agent píše API ve FastAPI/Express, frontend agent komponenty React. Každá změna = samostatný pull request s čistou commit zprávou. Standardy kódování (Black, ESLint, Prettier) jsou vynucovány automaticky.

3

Vícevrstvé testování

Unit (pytest, Jest), integrační (testcontainers s reálným PostgreSQL), E2E (Playwright), UI snapshot, security (OWASP, gitleaks, bandit), performance (k6/locust), accessibility (axe). Každý PR spouští celý pipeline — selhávající test blokuje merge.

4

Code review pomocí AI

Agent SecurityReviewer skenuje pod úhlem OWASP Top 10, agent QualityReviewer kontroluje čitelnost a vzory, agent ArchitectureReviewer ověřuje konzistenci se zbytkem systému. Hraniční případy eskalují k člověku.

5

Dokumentace a CHANGELOG

Každá změna logiky = bump verze + záznam v CHANGELOG.md ve formátu Keep a Changelog. Dokumentace API (OpenAPI/Swagger) se generuje automaticky. CLAUDE.md je aktualizován po každé session s novými lekcemi.

6

Nasazení s Change Request

Nasazení vždy přes Git (NIKDY přímý scp). Nejprve testovací prostředí s Playwright ověřením, pak teprve produkce po schválení CR. Deploy skript obsahuje plán rollback (<5 min) a health checks.

Co firma získává?

Tisíce automatizovaných testů

Každý produkční projekt má od několika tisíc až po desítky tisíc testů — unit, integrační, E2E, security, performance. Regrese jsou zachyceny v CI dříve, než se dostanou k uživateli.

Kompletní audit trail

Každá změna v kódu, databázi nebo konfiguraci je zaznamenána: Git, audit log v databázi, CHANGELOG, Change Request. Splňuje požadavky ISO 27001, EU AI Act a GDPR.

Škálovatelnost týmu

Dva nebo tři lidé s AI agenty dodávají hodnotu týmu o velikosti 8-10 osob. Bez vyhoření, s vyšší kvalitou a kratšími timeline.

Eskalace k silnějším modelům

LLM routing volí správný model pro každý úkol: drobné změny — lokální Ollama (nulové náklady), složitá architektura — Claude Opus. Optimalizace nákladů a kvality v jednom.

Opakovatelnost a standardy

Každý projekt používá stejné standardy: feature branch workflow, squash merge, Conventional Commits, CHANGELOG, EU AI Act, GDPR. Nový vývojář rozumí struktuře za jeden den.

Bezpečnost by default

Gitleaks při pre-commit + CI, tajemství v HashiCorp Vault, privátní repozitáře, Keycloak SSO, Tailscale VPN pro interní služby. Žádné kompromisy oproti rychlosti.

Vícevrstvé testování — základ kvality

Každá změna v produkčním kódu prochází kompletním pipeline testů. Bez výjimek — i oprava překlepu v komentáři spouští CI, protože test pipeline je vynucen Git hookem, ne politickým rozhodnutím vývojáře.

  • Jednotkové testy (unit): pytest, Jest, vitest. Pokrývají jednotlivé funkce a třídy. Pokrytí >80 % pro kritický kód.
  • Integrační testy: testcontainers s reálnými instancemi PostgreSQL, Redis, Vault. Mocky pouze pro externí API třetích stran.
  • End-to-end (E2E) testy: Playwright ve Firefoxu (výchozí), Chrome (volitelně). Simulují kompletní uživatelské cesty: login → akce → ověření.
  • UI testy (snapshot, accessibility): Playwright + axe-core. WCAG 2.0 AA jako baseline, Lighthouse 100/100/100/100 jako cíl.
  • Security testy: OWASP Top 10 (semgrep, bandit, eslint-plugin-security), gitleaks (skenování tajemství při pre-commit a CI), trivy (skenování Docker obrazů).
  • Výkonnostní testy: k6 nebo locust pro load testy, kontrola p95/p99 doby odezvy pod zátěží.
  • Regresní testy: celá sada se spouští před každým produkčním nasazením. Každý hlášený bug se stává regresním testem.
  • Smoke testy: minimální sada 5-10 testů spuštěných po produkčním nasazení (zda aplikace vůbec naběhla).
  • Akceptační testy: obchodní testy (Cucumber/Gherkin) potvrzující, že požadavek byl splněn.

Selhávající test = zablokovaný merge. Bez výjimek. Pokud je test „flaky" (nestabilní), diagnostický agent analyzuje příčinu a opravuje test nebo kód, ale nikdy neodstraňuje test bez rozhodnutí člověka.

Typické případy použití

Vzory, které uplatňujeme nejčastěji. Každý má vlastní sadu agentů, nástrojů a šablon. Time-to-value se měří v týdnech, ne v měsících.

Modernizace legacy systému

  • Stará monolitická aplikace (PHP/.NET, bez testů, obtížná na údržbu)
  • Agenti rozkládají monolit na mikroslužby (inkrementální proces, bez výpadku)
  • Generují charakterizační testy (zachycení současného chování) před refaktoringem
  • Migrace dat s kompletním audit trailem a plánem rollback

Nová enterprise mikroslužba

  • Specifikace na vstupu (Jira ticket, PRD dokument, transkripce schůzky)
  • Architektura → kód → testy → review → nasazení za 2-3 týdny
  • Integrace se stávajícím SSO (Keycloak), audit logem, monitoringem
  • Plná shoda s EU AI Act a GDPR od první řádky kódu

Integrace systémů

  • Propojení ERP, CRM, KRS, Microsoft Graph, IBM, Cisco, externí partneři
  • Agenti píší adaptéry, mapování, retry/backoff, idempotenci
  • Integrační testy na reálných endpointech (sandbox API)
  • Monitoring (Prometheus + Grafana) a alerty (Sentry) zapojené automaticky

Multi-tenant platformy

  • Multi-klientské SaaS s plnou izolací dat (per-tenant schéma nebo row-level security)
  • Automatizovaný onboarding klienta (Keycloak provisioning, databáze, role)
  • Billing založený na SSO Billing SDK (sledování spotřeby tokenů, fail-open)
  • Compliance: GDPR, ISO 27001, EU AI Act připraveno k auditu

Srovnání: klasický tým vs. AI-řízený proces

AspektKlasický tým (8-10 osob)Tým s AI agenty (2-3 osoby)
Time-to-market (průměrný feature)2-4 týdny3-7 dní
Pokrytí testy40-60 % (když má tým čas)>80 % defaultně (testy generované spolu s kódem)
Code review1 osoba, průměrně 30-60 min3 agenti (security, quality, architecture) + člověk u složitých změn
DokumentaceČasto neúplná, „dodělávaná"Generovaná spolu s kódem (OpenAPI, README, CHANGELOG)
Audit trailGit historyGit + audit log v databázi + CHANGELOG + Change Request
ŠkálováníLineární (více lidí = vyšší komunikační náklady)Nelineární (více agentů = stejný počet dohlížejících osob)
Compliance (EU AI Act, GDPR, ISO 27001)Často externí audit po faktuZabudované v procesu od první řádky kódu

Často kladené otázky

Co je automatizovaný vývoj software s AI?
Je to proces, ve kterém se specializovaní AI agenti účastní každé fáze životního cyklu vývoje software: od analýzy požadavků, přes návrh architektury, kódování, automatizované testy (unit, integrační, E2E, security, performance, regresní), až po code review a produkční nasazení. Člověk stále dohlíží na proces a dělá klíčová rozhodnutí, ale rutinní úkoly (psaní kódu, generování testů, refaktoring, dokumentace) provádějí AI agenti se zachováním dohodnutých standardů kvality.
Čím se to liší od klasického programování s Copilotem?
Copilot je auto-doplňování — pomáhá psát jednotlivé řádky kódu. Vývoj software s AI je kompletní orchestrace: jeden agent plánuje architekturu, druhý píše kód, třetí píše testy, čtvrtý dělá code review, pátý nasazuje. Každý má vlastní specializaci, epizodickou paměť (učí se z předchozích projektů), nástroje a kontext. Výsledek: výrazně větší rozsah automatizace než s jediným Copilotem, při zachování enterprise standardů (testy, security, audit trail).
Jaké typy testů tento proces spouští?
Každý druh testů, který zralé vývojové týmy používají: jednotkové (unit), integrační, end-to-end (E2E), UI (Playwright), bezpečnostní (OWASP Top 10, gitleaks), výkonnostní (load), regresní, smoke a akceptační. Testy se píší před nebo paralelně s kódem (TDD) a každá změna musí projít celým pipelinem.
Nasazuje AI kód do produkce sama?
Ne automaticky. Produkční nasazení vyžadují schválený Change Request (CR) a rozhodnutí člověka. AI agenti připravují dokumentaci změn, spouštějí regresní testy, generují deploy skripty s plány rollback, ale finální nasazení do produkce vyžaduje souhlas operátora. Toto pravidlo je záměrné — minimalizuje riziko nečekaných důsledků a zachovává kompletní audit trail.
Funguje tento proces pro enterprise projekty?
Ano. Používáme ho u vlastních produktů, včetně multi-agentní platformy HybridCrew, consulting platformy se SSO, mikroslužeb s PostgreSQL, integrací s externími systémy (KRS, MS Graph, IBM, Keycloak). Každý projekt má vlastní CI/CD pipeline, prostředí dev/test/prod, monitoring a audit log. Proces škáluje od jediné mikroslužby až po platformu s mnoha kontejnery.
Jak dlouho trvá zavedení tohoto procesu v naší firmě?
Záleží na kontextu. Pro malý tým (1-3 vývojáři) integrace se stávajícím repozitářem a CI/CD pipelinem typicky zabere 2-4 týdny: audit, konfigurace agentů, sladění se standardy kódování, školení. Pro větší organizace pilotní projekty (jeden tým, jedna mikroslužba) trvají 6-8 týdnů, následuje postupné rozšíření na další týmy.
Co se zabezpečením zdrojového kódu?
Klientské repozitáře nikdy neopouštějí firmu do externích služeb bez výslovného souhlasu. Defaultně celý proces (AI agenti, LLM modely, vektorová databáze, audit log) běží v infrastruktuře klienta nebo v privátním cloudu ESKOM AI s plnou izolací. Tajemství spravujeme přes HashiCorp Vault, kód skenujeme gitleaks před každým commitem a všechny repozitáře jsou defaultně privátní.
Nahradíte náš vývojový tým?
Ne. Zkušení vývojáři jsou nezbytní — navrhují architekturu, dělají rozhodnutí, recenzují složité změny, řeší netypické problémy. AI agenti přebírají opakované úkoly vhodné k automatizaci: psaní boilerplate, generování testů, dokumentace, refaktoring, code review prvního průchodu. Cíl: dva nebo tři lidé s AI dodávají hodnotu týmu o velikosti 8-10 osob — bez vyhoření, s vyšší kvalitou a plným audit trailem.
Kolik vývoj software s AI stojí?
Cena je vždy projektově specifická a závisí na rozsahu, modelu fakturace (předplatné platformy vs. dedikovaný projekt), požadovaných integracích a tom, zda agenti běží na lokálních LLM modelech (Ollama na GPU klienta — nižší provozní náklady) nebo v cloudu (Anthropic, OpenAI — vyšší flexibilita). V pilotech cílíme na návratnost investice v prvním kvartále od plného spuštění.
Jaké jsou typické signály, že je firma na tento proces připravena?
Nejlepší výsledky dosahují týmy, které již mají: verzovaný repozitář (Git), definované standardy kódování, základní CI/CD pipeline, jasně dokumentované požadavky (Jira/Linear/vlastní) a kulturu code review. Chybějící některý z těchto prvků zavedení neblokuje — začínáme tehdy auditem a přípravou základů. Nejméně zralé jsou organizace bez verzování nebo s produkčním kódem, který nikdo netestuje.

Připraveni na pilotní projekt?

Začínáme auditem stávajícího procesu a pilotem na vybrané mikroslužbě. První výsledky viditelné za 2-4 týdny. Bez závazku na víceleté kontrakty.