Pillar page

Vývoj softvéru s AI

Overený proces automatizácie vývoja s tímom AI agentov — od analýzy požiadaviek cez kódovanie a viacvrstvové testy (unit, integračné, E2E, security, performance) až po produkčné nasadenie s úplným audit trailom.

Disponujeme tímom špecializovaných AI agentov, ktorý sa zúčastňuje na každom štádiu cyklu vývoja softvéru — od analýzy požiadaviek cez návrh architektúry, kódovanie a viacvrstvové testy až po code review, dokumentáciu a nasadenie s úplným audit trailom.

Týmto spôsobom vyvíjame vlastné produkty ESKOM AI — multiagentovú platformu HybridCrew, systém pre audity Compliance, mikroslužbu KRS+CRBR a niekoľko integrácií. Rovnaký proces aplikujeme v projektoch pre klientov: pri budovaní nových mikroslužieb aj pri modernizácii legacy systémov.

Tento článok opisuje, ako to funguje v praxi: aké úlohy preberajú agenti a ktoré zostávajú na strane človeka, aké testy spúšťame a prečo je tento proces opakovateľný.

Prečo automatizovať vývoj?

Klasický cyklus vývoja softvéru (analýza → kód → testy → review → deploy) trvá v zrelom tíme typicky 2-4 týždne pre funkciu strednej veľkosti. Väčšina tohto času pripadá na opakovateľné úlohy: písanie boilerplate, generovanie jednotkových testov, revízia zmien, aktualizácia dokumentácie, generovanie migrácií databázy. Všetky vhodné na automatizáciu.

Cieľ nášho procesu je jednoduchý: dvaja-traja ľudia s AI agentmi dodávajú hodnotu, ktorú predtým prinášal tím 8-10 ľudí — bez vyhorenia, s vyššou kvalitou (viac testov, lepšie code review, kompletná dokumentácia) a skráteným time-to-market.

Toto nie je „AI nahradí programátorov". Toto je „programátori s AI nahradia programátorov bez AI". Skúsení inžinieri zostávajú nevyhnutní — navrhujú architektúru, robia strategické rozhodnutia, revidujú komplexné zmeny. Agenti preberajú rutinu.

Šesť etáp procesu

Pipeline od požiadaviek po produkciu. Každú etapu vykonávajú špecializovaní AI agenti, pričom človek dohliada a schvaľuje kľúčové rozhodnutia.

1

Analýza požiadaviek a architektúra

AI agenti analyzujú obchodnú dokumentáciu, rozhovory s klientom (z transkriptov), existujúci kód. Navrhujú mikroservisnú architektúru, schému databázy, zoznam endpointov, model oprávnení. Človek (CTO/architekt) revíduje a schvaľuje návrh pred kódovaním.

2

Písanie kódu (TDD)

Najprv testy, potom implementácia. Backend agent píše API vo FastAPI/Express, frontend agent komponenty React. Každá zmena = samostatný pull request s čitateľným commitom. Štandardy kódovania (Black, ESLint, Prettier) vynucované automaticky.

3

Viacvrstvové testy

Unit (pytest, Jest), integračné (testcontainers s reálnym PostgreSQL), E2E (Playwright), UI snapshot, security (OWASP, gitleaks, bandit), performance (k6/locust), accessibility (axe). Každý PR spúšťa kompletný pipeline — červený test = blok merge.

4

Code review s AI

Agent SecurityReviewer skenuje na OWASP Top 10, agent QualityReviewer kontroluje čitateľnosť a vzory, agent ArchitectureReviewer overuje konzistentnosť so zvyškom systému. Sporné miesta sa eskalujú na človeka.

5

Dokumentácia a CHANGELOG

Každá zmena logiky = bump verzie + záznam v CHANGELOG.md vo formáte Keep a Changelog. API dokumentácia (OpenAPI/Swagger) generovaná automaticky. CLAUDE.md aktualizovaný po každej relácii s novými lekciami.

6

Nasadenie cez Change Request

Deploy vždy cez Git (NIKDY priamy scp). Najprv testovacie prostredie, overenie Playwrightom, potom až produkcia po schválení CR. Skript deploy obsahuje plán rollback (<5 min) a health checks.

Čo firma získava?

Tisíce automatických testov

Každý produkčný projekt má od niekoľkých do niekoľkých desiatok tisíc testov — unit, integračné, E2E, security, performance. Regresie zachytené v CI ešte pred tým, ako sa dostanú k používateľovi.

Úplný audit trail

Každá zmena v kóde, databáze, konfigurácii je zaznamenaná: Git, audit log v databáze, CHANGELOG, Change Request. Spĺňa požiadavky ISO 27001, EU AI Act, GDPR.

Škálovateľnosť tímu

Dvaja-traja ľudia s AI agentmi dodávajú hodnotu, ktorú predtým prinášal tím 8-10 ľudí. Bez vyhorenia, s vyššou kvalitou a kratším timeline.

Eskalácia k silnejším modelom

Routing LLM vyberá vhodný model pre úlohu: drobné zmeny — lokálny Ollama (náklad $0), komplexná architektúra — Claude Opus. Optimalizácia nákladov a kvality v jednom.

Opakovateľnosť a štandardy

Každý projekt aplikuje rovnaké štandardy: feature branch workflow, squash merge, Conventional Commits, CHANGELOG, EU AI Act, GDPR. Nový vývojár rozumie štruktúre za 1 deň.

Bezpečnosť by default

Gitleaks na pre-commit + CI, tajomstvá v HashiCorp Vault, súkromné repozitáre, SSO Keycloak, Tailscale VPN pre interné služby. Žiadne kompromisy na úkor rýchlosti.

Viacvrstvové testy — základ kvality

Každá zmena v produkčnom kóde prechádza kompletným testovacím pipeline. Bez výnimiek — aj oprava preklepu v komentári spúšťa CI, pretože test pipeline je zabudovaný v Git hooku, nie v politickom rozhodnutí vývojára.

  • Jednotkové testy (unit): pytest, Jest, vitest. Overujú jednotlivé funkcie a triedy. Pokrytie >80 % pre kritický kód.
  • Integračné testy: testcontainers s reálnymi inštanciami PostgreSQL, Redis, Vault. Mocky iba pre externé third-party API.
  • E2E testy (end-to-end): Playwright vo Firefoxe (predvolene), Chrome (voliteľne). Simulujú celé používateľské cesty: login → akcia → overenie.
  • UI testy (snapshot, accessibility): Playwright + axe-core. WCAG 2.0 AA ako baseline, Lighthouse 100/100/100/100 ako cieľ.
  • Bezpečnostné testy: OWASP Top 10 (semgrep, bandit, eslint-plugin-security), gitleaks (skenovanie tajomstiev na pre-commit a CI), trivy (skenovanie Docker obrazov).
  • Výkonnostné testy: k6 alebo locust pre load testy, kontrola p95/p99 response time pod záťažou.
  • Regresné testy: kompletná sada spustená pred každým produkčným deployom. Každý nahlásený bug sa stáva regresným testom.
  • Smoke testy: minimálny set 5-10 testov spustených po deployi na produkčnom prostredí (či aplikácia vôbec nabehla).
  • Acceptance testy: obchodné testy (Cucumber/Gherkin) potvrdzujúce, že požiadavka bola splnená.

Červený test = blok merge. Bez výnimiek. Ak je test „flaky" (nestabilný), diagnostický agent analyzuje príčinu a opraví test alebo kód, ale nikdy neodstráni test bez rozhodnutia človeka.

Typické prípady použitia

Vzory, ktoré používame najčastejšie. Každý má vlastnú sadu agentov, nástrojov a šablón. Time-to-value meraný v týždňoch, nie v mesiacoch.

Modernizácia legacy systému

  • Stará monolitická aplikácia (PHP/.NET, žiadne testy, ťažká údržba)
  • Agenti rozkladajú monolit na mikroslužby (inkrementálny proces, bez výpadku)
  • Generujú charakterizačné testy (zachytenie aktuálneho správania) pred refaktoringom
  • Migrácia dát s úplným audit trailom a plánom rollback

Nová enterprise mikroslužba

  • Špecifikácia na vstupe (Jira ticket, PRD, transkript stretnutia)
  • Architektúra → kód → testy → review → deploy za 2-3 týždne
  • Integrácia s existujúcim SSO (Keycloak), audit logom, monitoringom
  • Plná zhoda s EU AI Act a GDPR od prvého riadku kódu

Integrácia systémov

  • Prepojenie ERP, CRM, KRS, Microsoft Graph, IBM, Cisco, externí partneri
  • Agenti píšu adaptéry, mapovania, retry/backoff, idempotenciu
  • Integračné testy na reálnych endpointoch (sandbox API)
  • Monitoring (Prometheus + Grafana) a alerty (Sentry) zapojené automaticky

Multi-tenant platformy

  • Multiklientske SaaS s plnou izoláciou dát (per-tenant schema alebo row-level security)
  • Onboarding klienta automatizovaný (provisioning Keycloak, databáza, role)
  • Billing založený na SSO Billing SDK (token usage tracking, fail-open)
  • Compliance: GDPR, ISO 27001, EU AI Act pripravené na audit

Porovnanie: klasický tím vs. proces s AI

AspektKlasický tím (8-10 ľudí)Tím s AI agentmi (2-3 ľudia)
Time-to-market (priemerná funkcia)2-4 týždne3-7 dní
Pokrytie testami40-60 % (ak má tím čas)>80 % predvolene (testy generované spolu s kódom)
Code review1 osoba, v priemere 30-60 min3 agenti (security, quality, architecture) + človek pri komplexných zmenách
DokumentáciaČasto nekompletná, „dorábaná"Generovaná spolu s kódom (OpenAPI, README, CHANGELOG)
Audit trailGit historyGit + audit log v databáze + CHANGELOG + Change Request
ŠkálovanieLineárne (viac ľudí = vyšší náklad komunikácie)Nelineárne (viac agentov = ten istý počet ľudí dohliada)
Compliance (EU AI Act, GDPR, ISO 27001)Často externý audit po fakteZabudované v procese od prvého riadku kódu

Najčastejšie otázky

Čo je automatizovaný vývoj softvéru s AI?
Je to proces, v ktorom špecializovaní AI agenti participujú na každom štádiu cyklu vývoja softvéru: od analýzy požiadaviek cez návrh architektúry, kódovanie, automatické testy (unit, integračné, E2E, security, performance, regresné) až po code review a produkčné nasadenie. Človek naďalej dohliada na proces a robí kľúčové rozhodnutia, ale rutinné úlohy (písanie kódu, generovanie testov, refaktoring, dokumentácia) vykonávajú AI agenti pri zachovaní dohodnutých štandardov kvality.
Čím sa tento proces líši od klasického programovania s Copilotom?
Copilot je autocomplete — pomáha písať jednotlivé riadky kódu. Vývoj softvéru s AI je úplná orchestrácia: jeden agent plánuje architektúru, druhý píše kód, tretí píše testy, štvrtý robí code review, piaty nasadzuje. Každý má vlastnú špecializáciu, epizodickú pamäť (učí sa z predchádzajúcich projektov), nástroje a kontext. Výsledok: výrazne väčšia škála automatizácie ako pri jedinom Copilote, so zachovaním enterprise štandardov (testy, security, audit trail).
Aké typy testov tento proces spúšťa?
Každý druh testov, ktorý sa používa v zrelých vývojárskych tímoch: jednotkové (unit), integračné, end-to-end (E2E), UI (Playwright), bezpečnostné (OWASP Top 10, gitleaks), výkonnostné (load), regresné, smoke a acceptance. Testy sú písané pred kódom alebo paralelne s ním (TDD) a každá zmena vyžaduje prejdenie celého pipeline.
Nasadzuje AI kód do produkcie samostatne?
Nie automaticky. Produkčné nasadenia vyžadujú schválený Change Request (CR) a rozhodnutie človeka. AI agenti pripravujú dokumentáciu zmien, spúšťajú regresné testy, generujú deploy skripty s plánom rollback, ale finálne spustenie na produkcii vyžaduje súhlas operátora. Toto pravidlo je zámerné — minimalizuje riziko nepredvídaných následkov a zachováva úplný audit trail.
Funguje tento proces pri enterprise projektoch?
Áno. Používame ho v našich vlastných produktoch vrátane platformy HybridCrew (multiagentová), konzultačnej platformy s SSO, mikroslužieb s PostgreSQL, integrácií s externými systémami (KRS, MS Graph, IBM, Keycloak). Každý projekt má vlastný CI/CD pipeline, prostredia dev/test/prod, monitoring a audit log. Proces sa škáluje od jedinej mikroslužby po platformu s mnohými kontajnermi.
Ako dlho trvá zavedenie tohto procesu v našej firme?
Závisí od kontextu. Pre malý tím (1-3 vývojári) integrácia s existujúcim repozitárom a CI/CD pipeline trvá typicky 2-4 týždne: audit, konfigurácia agentov, prispôsobenie štandardom kódovania, školenie. Pre väčšie organizácie pilotné projekty (jeden tím, jedna mikroslužba) trvajú 6-8 týždňov, po ktorých nasleduje postupné rozšírenie na ďalšie tímy.
Čo s bezpečnosťou zdrojového kódu?
Repozitáre klienta nikdy nejdú do externých služieb bez výslovného súhlasu. Predvolene celý proces (AI agenti, LLM modely, vektorová databáza, audit log) beží v infraštruktúre klienta alebo v privátnom cloude ESKOM AI s plnou izoláciou. Tajomstvá spravujeme cez HashiCorp Vault, kód skenujeme gitleaksom pred každým commitom a všetky repozitáre sú predvolene súkromné.
Nahradíte náš vývojársky tím?
Nie. Skúsení vývojári sú nevyhnutní — navrhujú architektúru, robia rozhodnutia, revidujú komplexné zmeny, riešia neobvyklé problémy. AI agenti preberajú opakovateľné úlohy vhodné na automatizáciu: písanie boilerplate, generovanie testov, dokumentáciu, refaktoring, code review prvej úrovne. Cieľ: dvaja-traja ľudia s AI dodávajú hodnotu, ktorú predtým prinášal tím 8-10 ľudí — bez vyhorenia, s vyššou kvalitou a úplným audit trailom.
Koľko stojí vývoj softvéru s AI?
Cena je vždy individuálna a závisí od rozsahu, modelu fakturácie (predplatné platformy vs. dedikovaný projekt), požadovaných integrácií a od toho, či agenti bežia na lokálnych LLM modeloch (Ollama na GPU klienta — nižšie prevádzkové náklady) alebo v cloude (Anthropic, OpenAI — vyššia flexibilita). V pilotných projektoch sa snažíme dosiahnuť návratnosť investície v prvom kvartáli od úplného spustenia.
Aké sú typické signály, že firma je pripravená na tento proces?
Najlepšie výsledky dosahujú tímy, ktoré už majú: repozitár pod kontrolou verzií (Git), definované štandardy kódovania, základný CI/CD pipeline, jasne dokumentované požiadavky (Jira/Linear/vlastné) a kultúru code review. Absencia niektorého z týchto prvkov neblokuje zavedenie — začíname vtedy auditom a prípravou základov. Najmenej zrelé sú organizácie bez kontroly verzií alebo s produkčným kódom, ktorý nikto netestuje.

Pripravení na pilotný projekt?

Začíname auditom existujúceho procesu a pilotom na vybranej mikroslužbe. Prvé výsledky viditeľné za 2-4 týždne. Bez záväzkov dlhodobých kontraktov.