Pillar page

Tarkvaraarendus AI-ga

Tõestatud protsess tarkvaraarenduse automatiseerimiseks AI agentide meeskonnaga — alates nõuete analüüsist, läbi kodeerimise ja mitmekihilise testimise (unit, integratsioon, E2E, turvalisus, jõudlus), kuni produktsioonijuurutuseni täieliku auditeerimisjäljega.

Meil on spetsialiseeritud AI agentide meeskond, mis osaleb tarkvaraarenduse igas etapis — nõuete analüüsist arhitektuuri projekteerimise, kodeerimise ja mitmekihilise testimiseni, samuti koodi ülevaatuse, dokumentatsiooni ja juurutamiseni täieliku auditeerimisjäljega.

Nii ehitame me oma ESKOM AI tooteid — multi-agent platvorm HybridCrew, Compliance auditisüsteem, KRS+CRBR mikroteenus ja portfell integratsioone. Sama protsessi rakendame ka klientide projektides: nii uute mikroteenuste loomisel kui ka legacy-süsteemide moderniseerimisel.

See artikkel kirjeldab, kuidas see praktikas toimib: milliseid ülesandeid võtavad üle agendid, millised jäävad inimeste hooleks, milliseid teste me käivitame ja miks see protsess on eri projektitüüpides korratav.

Miks automatiseerida tarkvaraarendust?

Klassikaline tarkvaraarenduse tsükkel (analüüs → kood → testid → ülevaatus → juurutus) võtab küpses meeskonnas keskmise suurusega funktsionaalsuse jaoks tüüpiliselt 2-4 nädalat. Suurem osa sellest ajast kulub korduvatele ülesannetele: boilerplate'i kirjutamine, üksiktestide genereerimine, muudatuste ülevaatus, dokumentatsiooni uuendamine, andmebaasi migratsioonide genereerimine. Kõik need on automatiseerimiseks sobivad.

Meie protsessi eesmärk on lihtne: kaks-kolm inimest AI agentidega annavad väärtust, mida varem andis 8-10 inimese meeskond — ilma läbipõlemiseta, kõrgema kvaliteediga (rohkem teste, parem koodi ülevaatus, täielik dokumentatsioon) ja lühema turule jõudmise ajaga.

See ei ole „AI asendab arendajaid". See on „arendajad AI-ga asendavad arendajad ilma AI-ta". Kogenud inseneride järele on endiselt vajadus — nad projekteerivad arhitektuuri, teevad strateegilisi otsuseid, vaatavad üle keerukaid muudatusi. Agendid võtavad üle rutiini.

Kuueetapiline protsess

Töövoog nõuetest tootmiseni. Iga etappi viivad ellu spetsialiseeritud AI agendid, samal ajal kui inimesed jälgivad ja kinnitavad võtmeotsused.

1

Nõuete analüüs ja arhitektuur

AI agendid analüüsivad äridokumentatsiooni, kliendi vestlusi (transkriptsioonidest) ja olemasolevat koodi. Nad pakuvad välja mikroteenuse arhitektuuri, andmebaasi skeemi, lõpp-punktide nimekirja ja õiguste mudeli. Inimene (CTO/arhitekt) vaatab ettepaneku üle ja kinnitab selle enne kodeerimise alustamist.

2

Koodi kirjutamine (TDD)

Kõigepealt testid, siis implementatsioon. Backend-agent kirjutab API-d FastAPI/Express'is, frontend-agent React'i komponente. Iga muudatus on eraldi pull request selge commit-sõnumiga. Kodeerimisstandardid (Black, ESLint, Prettier) on automaatselt jõustatud.

3

Mitmekihiline testimine

Unit (pytest, Jest), integratsioon (testcontainers reaalse PostgreSQL-iga), E2E (Playwright), UI snapshot, turvalisus (OWASP, gitleaks, bandit), jõudlus (k6/locust), ligipääsetavus (axe). Iga PR käivitab täieliku toruliini — ebaõnnestunud test blokeerib merge'i.

4

AI koodi ülevaatus

SecurityReviewer agent skannib OWASP Top 10 probleemide suhtes, QualityReviewer agent kontrollib loetavust ja mustreid, ArchitectureReviewer agent verifitseerib kooskõla ülejäänud süsteemiga. Piirjuhud eskaleeritakse inimestele.

5

Dokumentatsioon ja CHANGELOG

Iga loogika muudatus = versiooni tõstmine + sissekanne CHANGELOG.md-sse Keep a Changelog formaadis. API dokumentatsioon (OpenAPI/Swagger) genereeritakse automaatselt. CLAUDE.md uuendatakse pärast iga sessiooni uute õppetundidega.

6

Juurutamine Change Request'iga

Juurutamine käib alati Git'i kaudu (MITTE KUNAGI otsene scp). Esmalt testkeskkond Playwright'i verifikatsiooniga, seejärel tootmine pärast CR-i kinnitamist. Juurutamise skript sisaldab rollback-plaani (<5 min) ja terviseseiret.

Mida ettevõte sellega võidab?

Tuhandeid automaatseid teste

Igal tootmisprojektil on mitmest tuhandest kuni mitukümmend tuhandet testi — unit, integratsioon, E2E, turvalisus, jõudlus. Regressioonid püütakse kinni CI-s enne, kui need jõuavad kasutajateni.

Täielik auditeerimisjälg

Iga muudatus koodis, andmebaasis või konfiguratsioonis on salvestatud: Git, auditlogi andmebaasis, CHANGELOG, Change Request. Vastab ISO 27001, EU AI Act ja GDPR nõuetele.

Meeskonna skaleeritavus

Kaks-kolm inimest AI agentidega annavad väärtust, mida varem andis 8-10 inimese meeskond. Ilma läbipõlemiseta, kõrgema kvaliteediga ja lühemate ajakavadega.

Eskaleerimine tugevamatele mudelitele

LLM-i marsruutimine valib iga ülesande jaoks õige mudeli: väiksemad muudatused — kohalik Ollama (kulu $0), keerukas arhitektuur — Claude Opus. Kulu ja kvaliteedi optimeerimine ühes.

Korratavus ja standardid

Iga projekt järgib samu standardeid: feature branch workflow, squash merge, Conventional Commits, CHANGELOG, EU AI Act, GDPR. Uus arendaja mõistab struktuuri esimesel päeval.

Turvalisus vaikimisi

Gitleaks pre-commit'il + CI-s, saladused HashiCorp Vault'is, privaatsed repositooriumid, Keycloak SSO, Tailscale VPN sisemiste teenuste jaoks. Kompromisse kiiruse osas pole.

Mitmekihiline testimine — kvaliteedi alus

Iga muudatus tootmiskoodis läbib täieliku testitoruliini. Erandeid pole — isegi kommentaaris kirjavea parandamine käivitab CI, sest testitoruliini jõustab Git hook, mitte arendaja poliitiline otsus.

  • Üksiktestid (unit): pytest, Jest, vitest. Katavad üksikuid funktsioone ja klasse. >80% kate kriitilise koodi puhul.
  • Integratsioonitestid: testcontainers PostgreSQL-i, Redis-e, Vault'i reaalsete instantsidega. Mock'id ainult kolmandate osapoolte väliste API-de jaoks.
  • End-to-end (E2E) testid: Playwright Firefox'is (vaikimisi), Chrome'is (valikuline). Simuleerivad täielikke kasutaja teekondi: sisselogimine → tegevus → verifikatsioon.
  • UI testid (snapshot, ligipääsetavus): Playwright + axe-core. WCAG 2.0 AA baasväärtusena, Lighthouse 100/100/100/100 sihina.
  • Turvalisustestid: OWASP Top 10 (semgrep, bandit, eslint-plugin-security), gitleaks (saladuste skaneerimine pre-commit'is ja CI-s), trivy (Docker'i imedite skaneerimine).
  • Jõudlustestid: k6 või locust koormustestide jaoks, p95/p99 vastuse aegade kontrollimine koormuse all.
  • Regressioonitestid: täielik komplekt käivitatakse enne iga tootmisjuurutust. Iga teatatud viga muutub regressioonitestiks.
  • Smoke-testid: minimaalne 5-10 testi komplekt, mis käivitatakse pärast tootmisjuurutust (kas rakendus üldse käivitus).
  • Acceptance-testid: äritestid (Cucumber/Gherkin), mis kinnitavad nõude täitmist.

Ebaõnnestunud test = blokeeritud merge. Erandeid pole. Kui test on „flaky" (ebastabiilne), analüüsib diagnostikaagent algpõhjust ja parandab testi või koodi, kuid ei eemalda kunagi testi ilma inimese otsuseta.

Tüüpilised kasutusjuhud

Mustrid, mida me kõige sagedamini rakendame. Igaühel on oma agentide, tööriistade ja mallide komplekt. Aeg väärtuseni mõõdetuna nädalates, mitte kuudes.

Legacy-süsteemi moderniseerimine

  • Vana monoliitne rakendus (PHP/.NET, testideta, raske hooldada)
  • Agendid lahutavad monoliidi mikroteenusteks (inkrementaalselt, ilma seisakuajata)
  • Genereerivad iseloomulikke teste (praeguse käitumise jäädvustamine) enne refaktoreerimist
  • Andmete migreerimine täieliku auditeerimisjälje ja rollback-plaaniga

Uus ettevõtte mikroteenus

  • Spetsifikatsioon sisendina (Jira pilet, PRD, koosoleku transkriptsioon)
  • Arhitektuur → kood → testid → ülevaatus → juurutus 2-3 nädalaga
  • Integratsioon olemasoleva SSO (Keycloak), auditlogi, monitooringuga
  • Täielik EU AI Act ja GDPR vastavus esimesest päevast

Süsteemide integratsioon

  • ERP, CRM, KRS, Microsoft Graph, IBM, Cisco, väliste partnerite ühendamine
  • Agendid kirjutavad adaptereid, vastendusi, retry/backoff, idempotentsust
  • Integratsioonitestid päris lõpp-punktidel (sandbox API-d)
  • Monitooring (Prometheus + Grafana) ja häired (Sentry) ühendatakse automaatselt

Multi-tenant platvormid

  • Mitme kliendi SaaS täieliku andmete isolatsiooniga (per-tenant skeem või row-level security)
  • Automaatne kliendi onboarding (Keycloak provisioneerimine, andmebaas, rollid)
  • Arvelduspõhi SSO Billing SDK-l (tokenite kasutuse jälgimine, fail-open)
  • Compliance: GDPR, ISO 27001, EU AI Act auditiks valmis

Võrdlus: klassikaline meeskond vs. AI-juhitud protsess

AspektKlassikaline meeskond (8-10 inimest)Meeskond AI agentidega (2-3 inimest)
Turule jõudmise aeg (keskmine funktsioon)2-4 nädalat3-7 päeva
Testikate40-60% (kui meeskonnal on aega)>80% vaikimisi (testid genereeritakse koos koodiga)
Koodi ülevaatus1 inimene, keskmiselt 30-60 min3 agenti (turvalisus, kvaliteet, arhitektuur) + inimene keerukate muudatuste puhul
DokumentatsioonSageli mittetäielik, „lisatud hiljem"Genereeritakse koos koodiga (OpenAPI, README, CHANGELOG)
AuditeerimisjälgGit'i ajaluguGit + auditlogi andmebaasis + CHANGELOG + Change Request
SkaleerimineLineaarne (rohkem inimesi = kõrgem suhtluskulu)Mittelineaarne (rohkem agente = sama arv järelevalvajaid)
Compliance (EU AI Act, GDPR, ISO 27001)Sageli väline audit tagantjäreleSisse ehitatud protsessi esimesest päevast

Korduma kippuvad küsimused

Mis on automatiseeritud AI tarkvaraarendus?
See on protsess, kus spetsialiseeritud AI agendid osalevad tarkvaraarenduse igas etapis: nõuete analüüsist, läbi arhitektuuri projekteerimise, kodeerimise, automaatsete testide (unit, integratsioon, E2E, turvalisus, jõudlus, regressioon), kuni koodi ülevaatuse ja tootmisjuurutuseni. Inimesed jätkavad protsessi juhendamist ja võtmeotsuste tegemist, kuid rutiinsed ülesanded (koodi kirjutamine, testide genereerimine, refaktoreerimine, dokumentatsioon) viivad ellu AI agendid, säilitades kokku lepitud kvaliteedistandardid.
Mille poolest see erineb klassikalisest programmeerimisest Copilotiga?
Copilot on autocomplete — see aitab kirjutada üksikuid koodi ridu. AI tarkvaraarendus on täielik orkestratsioon: üks agent planeerib arhitektuuri, teine kirjutab koodi, kolmas kirjutab testid, neljas teeb koodi ülevaatuse, viies juurutab. Igal on oma spetsialiseerumine, episoodiline mälu (õpib varasematest projektidest), tööriistad ja kontekst. Tulemus: oluliselt suurem automatiseerimise skaala kui üksiku Copilotiga, säilitades ettevõtte standardid (testid, turvalisus, auditeerimisjälg).
Milliseid teste see protsess käivitab?
Iga tüüpi teste, mida küpsed arendusmeeskonnad kasutavad: üksiktestid (unit), integratsioonitestid, end-to-end (E2E), UI (Playwright), turvalisustestid (OWASP Top 10, gitleaks), jõudlus (load), regressioon, smoke ja acceptance. Testid kirjutatakse enne või koos koodiga (TDD) ja iga muudatus peab läbima täieliku toruliini.
Kas AI juurutab koodi tootmisesse iseseisvalt?
Ei — mitte automaatselt. Tootmisjuurutused nõuavad heakskiidetud Change Request'i (CR) ja inimese otsust. AI agendid valmistavad ette muudatuste dokumentatsiooni, käivitavad regressioonitestid, genereerivad juurutamise skripte rollback-plaanidega, kuid lõplik tootmisesse väljaandmine nõuab operaatori heakskiitu. See reegel on tahtlik — see minimeerib ootamatute tagajärgede riski ja säilitab täieliku auditeerimisjälje.
Kas see protsess sobib ettevõtteprojektidele?
Jah. Me kasutame seda oma toodete puhul, sealhulgas HybridCrew multi-agent platvorm, SSO-ga konsultatsiooniplatvorm, PostgreSQL-il põhinevad mikroteenused, integratsioonid väliste süsteemidega (KRS, MS Graph, IBM, Keycloak). Igal projektil on oma CI/CD toruliin, dev/test/prod keskkonnad, monitooring ja auditlogi. Protsess skaleerub ühest mikroteenusest mitmekontaineri platvormini.
Kui kaua võtab selle protsessi juurutamine meie ettevõttes?
See sõltub kontekstist. Väikese meeskonna jaoks (1-3 arendajat) võtab integreerimine olemasoleva repositooriumi ja CI/CD toruliiniga tüüpiliselt 2-4 nädalat: audit, agentide konfiguratsioon, kohandumine kodeerimisstandarditega, koolitus. Suuremate organisatsioonide puhul kestavad piloodiprojektid (üks meeskond, üks mikroteenus) 6-8 nädalat, millele järgneb järkjärguline laienemine täiendavatele meeskondadele.
Aga lähtekoodi turvalisus?
Kliendi repositooriumid ei lähe kunagi välistele teenustele ilma selgesõnalise nõusolekuta. Vaikimisi töötab kogu protsess (AI agendid, LLM mudelid, vektorandmebaas, auditlogi) kliendi infrastruktuuris või ESKOM AI privaatses pilves täieliku isolatsiooniga. Saladusi hallatakse HashiCorp Vault'i kaudu, koodi skaneeritakse enne iga commit'i gitleaksiga ja kõik repositooriumid on vaikimisi privaatsed.
Kas asendate meie arendusmeeskonna?
Ei. Kogenud arendajad on hädavajalikud — nad projekteerivad arhitektuuri, teevad otsuseid, vaatavad üle keerukaid muudatusi, lahendavad ebatavalisi probleeme. AI agendid võtavad üle korduvaid, automatiseerimisele sobivaid ülesandeid: boilerplate'i kirjutamine, testide genereerimine, dokumentatsioon, refaktoreerimine, esimese taseme koodi ülevaatus. Eesmärk: kaks-kolm inimest AI-ga annavad väärtust, mida varem andis 8-10 inimese meeskond — ilma läbipõlemiseta, kõrgema kvaliteediga ja täieliku auditeerimisjäljega.
Kui palju maksab AI tarkvaraarendus?
Hinnastamine on alati projektipõhine ja sõltub skaalast, arveldusmudelist (platvormi tellimus vs. dedikeeritud projekt), nõutavatest integratsioonidest ning sellest, kas agendid töötavad kohalikel LLM mudelitel (Ollama kliendi GPU-l — madalam tegevuskulu) või pilves (Anthropic, OpenAI — kõrgem paindlikkus). Piloodide puhul püüame saavutada investeeringutasuvuse esimese kvartali jooksul pärast täielikku käivitamist.
Millised on tüüpilised märgid, et ettevõte on selleks protsessiks valmis?
Parimad tulemused tulevad meeskondadelt, kellel on juba olemas: versioonihaldusega repositoorium (Git), määratletud kodeerimisstandardid, baas CI/CD toruliin, selgelt dokumenteeritud nõuded (Jira/Linear/oma) ja koodi ülevaatuse kultuur. Mõne neist puudumine ei blokeeri juurutamist — alustame siis auditi ja alustöödega. Kõige vähem küpsed on organisatsioonid, kellel pole versioonihaldust või kelle tootmiskoodi keegi ei testi.

Valmis piloodiks?

Alustame olemasoleva protsessi auditist ja piloodist valitud mikroteenuse peal. Esimesed tulemused nähtavad 2-4 nädala jooksul. Pikaajalisi lepinguid pole vaja.