Pillar page

Разработка на софтуер с ИИ

Доказан процес за автоматизация на разработката на софтуер с екип от ИИ агенти — от анализ на изискванията, през кодиране и многослойни тестове (unit, integration, E2E, security, performance), до производствено внедряване с пълен audit trail.

Разполагаме с екип от специализирани ИИ агенти, който участва във всеки етап от жизнения цикъл на разработка на софтуер — от анализ на изискванията, през проектиране на архитектурата, кодиране и многослойни тестове, до code review, документация и внедряване с пълен audit trail.

Така изграждаме собствените продукти на ESKOM AI — мултиагентната платформа HybridCrew, системата за одити Compliance, микросервиза KRS+CRBR и портфолио от интеграции. Прилагаме същия процес и при клиентски проекти: както при изграждане на нови микросервизи, така и при модернизация на legacy системи.

Тази статия описва как това работи на практика: кои задачи поемат агентите, кои остават при хората, какви тестове изпълняваме и защо този процес е повторяем за различни типове проекти.

Защо да автоматизираме разработката на софтуер?

Класическият цикъл на разработка (анализ → код → тестове → review → deploy) в зрял екип обикновено отнема 2-4 седмици за функция със средна сложност. По-голямата част от това време отива за повтарящи се задачи: писане на boilerplate, генериране на unit тестове, преглед на промени, актуализация на документация, генериране на миграции на база данни. Всички подлежащи на автоматизация.

Целта на нашия процес е проста: двама-трима души с ИИ агенти доставят стойност, която по-рано осигуряваше екип от 8-10 души — без прегаряне, с по-високо качество (повече тестове, по-добър code review, пълна документация) и по-кратко time-to-market.

Това не е „ИИ ще замени програмистите". Това е „програмисти с ИИ ще заменят програмистите без ИИ". Опитните инженери остават незаменими — те проектират архитектурата, вземат стратегически решения, ревюират сложните промени. Агентите поемат рутината.

Шест етапа на процеса

Пайплайн от изискванията до продукцията. Всеки етап се изпълнява от специализирани ИИ агенти, а хората надзирават и одобряват ключовите решения.

1

Анализ на изискванията и архитектура

ИИ агентите анализират бизнес документация, разговори с клиента (от транскрипции), съществуващ код. Предлагат микросервизна архитектура, схема на базата данни, списък с endpoints, модел на разрешенията. Човек (CTO/архитект) ревюира и одобрява предложението преди започване на кодирането.

2

Писане на код (TDD)

Първо тестове, после имплементация. Backend агент пише API на FastAPI/Express, frontend агент пише React компоненти. Всяка промяна = отделен pull request с чисто commit съобщение. Стандартите за кодиране (Black, ESLint, Prettier) се налагат автоматично.

3

Многослойни тестове

Unit (pytest, Jest), integration (testcontainers с реален PostgreSQL), E2E (Playwright), UI snapshot, security (OWASP, gitleaks, bandit), performance (k6/locust), accessibility (axe). Всеки PR минава през пълния пайплайн — провален тест блокира merge.

4

Code review с ИИ

Агент SecurityReviewer сканира за OWASP Top 10, агент QualityReviewer проверява четливост и патерни, агент ArchitectureReviewer верифицира съгласуваност с останалата част от системата. Граничните случаи се ескалират към хора.

5

Документация и CHANGELOG

Всяка промяна в логиката = bump на версията + запис в CHANGELOG.md във формат Keep a Changelog. API документация (OpenAPI/Swagger) се генерира автоматично. CLAUDE.md се актуализира след всяка сесия с новонаучени уроци.

6

Внедряване с Change Request

Deploy винаги през Git (НИКОГА директен scp). Първо тестова среда с верификация чрез Playwright, после продукция след одобрение на CR. Deploy скриптът включва план за rollback (<5 мин) и health checks.

Какво печели компанията?

Хиляди автоматизирани тестове

Всеки продукционен проект има от няколко хиляди до десетки хиляди тестове — unit, integration, E2E, security, performance. Регресиите се хващат в CI преди да стигнат до потребителите.

Пълен audit trail

Всяка промяна в код, база данни или конфигурация е записана: Git, audit log в базата, CHANGELOG, Change Request. Отговаря на изискванията на ISO 27001, EU AI Act и GDPR.

Скалируемост на екипа

Двама-трима души с ИИ агенти доставят стойност на екип от 8-10 души. Без прегаряне, с по-високо качество и по-кратки срокове.

Ескалация към по-силни модели

LLM routing избира правилния модел за всяка задача: малки промени — локален Ollama (нулева цена), сложна архитектура — Claude Opus. Оптимизация на цена и качество в едно.

Повторяемост и стандарти

Всеки проект следва същите стандарти: feature branch workflow, squash merge, Conventional Commits, CHANGELOG, EU AI Act, GDPR. Нов разработчик разбира структурата за един ден.

Сигурност по подразбиране

Gitleaks на pre-commit + CI, тайни в HashiCorp Vault, частни хранилища, Keycloak SSO, Tailscale VPN за вътрешни услуги. Без компромиси за сметка на скоростта.

Многослойни тестове — фундаментът на качеството

Всяка промяна в продукционен код минава през пълен тестов пайплайн. Без изключения — дори поправяне на typo в коментар стартира CI, защото тестовият пайплайн се налага от Git hook, а не от политическо решение на разработчик.

  • Unit тестове: pytest, Jest, vitest. Покриват отделни функции и класове. >80% покритие за критичен код.
  • Integration тестове: testcontainers с реални инстанции на PostgreSQL, Redis, Vault. Mock-ове само за външни third-party API.
  • End-to-end (E2E) тестове: Playwright във Firefox (по подразбиране), Chrome (опционално). Симулират пълни потребителски пътеки: login → действие → верификация.
  • UI тестове (snapshot, accessibility): Playwright + axe-core. WCAG 2.0 AA като baseline, Lighthouse 100/100/100/100 като цел.
  • Security тестове: OWASP Top 10 (semgrep, bandit, eslint-plugin-security), gitleaks (сканиране на тайни на pre-commit и CI), trivy (сканиране на Docker образи).
  • Performance тестове: k6 или locust за load тестове, проверка на p95/p99 response time под натоварване.
  • Regression тестове: пълният suite се изпълнява преди всеки продукционен deploy. Всеки докладван bug става regression тест.
  • Smoke тестове: минимален набор от 5-10 теста, изпълнявани след продукционния deploy (дали приложението изобщо е стартирало).
  • Acceptance тестове: бизнес тестове (Cucumber/Gherkin), потвърждаващи, че изискването е изпълнено.

Провален тест = блокиран merge. Без изключения. Ако тестът е „flaky" (нестабилен), диагностичен агент анализира първопричината и поправя теста или кода, но никога не премахва тест без решение на човек.

Типични сценарии

Шаблоните, които прилагаме най-често. Всеки идва със собствен набор от агенти, инструменти и шаблони. Time-to-value измерено в седмици, не в месеци.

Модернизация на legacy системи

  • Старо монолитно приложение (PHP/.NET, без тестове, трудно за поддръжка)
  • Агентите разделят монолита на микросервизи (инкрементално, без downtime)
  • Генерират характеризиращи тестове (захващащи текущото поведение) преди рефакторинг
  • Миграция на данни с пълен audit trail и план за rollback

Нов enterprise микросервиз

  • Спецификация на вход (Jira ticket, PRD, транскрипция от среща)
  • Архитектура → код → тестове → review → deploy за 2-3 седмици
  • Интеграция със съществуващо SSO (Keycloak), audit log, мониторинг
  • Пълно съответствие с EU AI Act и GDPR от първия ден

Системна интеграция

  • Свързване на ERP, CRM, KRS, Microsoft Graph, IBM, Cisco, външни партньори
  • Агентите пишат адаптери, мапинги, retry/backoff, идемпотентност
  • Integration тестове на реални endpoints (sandbox API)
  • Мониторинг (Prometheus + Grafana) и алерти (Sentry) свързани автоматично

Multi-tenant платформи

  • Multi-client SaaS с пълна изолация на данни (per-tenant schema или row-level security)
  • Автоматизиран onboarding на клиенти (Keycloak provisioning, база данни, роли)
  • Билинг базиран на SSO Billing SDK (token usage tracking, fail-open)
  • Compliance: GDPR, ISO 27001, EU AI Act готови за одит

Сравнение: класически екип vs. процес с ИИ

АспектКласически екип (8-10 души)Екип с ИИ агенти (2-3 души)
Time-to-market (средна функция)2-4 седмици3-7 дни
Покритие с тестове40-60% (когато екипът има време)>80% по подразбиране (тестовете се генерират заедно с кода)
Code review1 човек, средно 30-60 мин3 агента (security, quality, architecture) + човек при сложни промени
ДокументацияЧесто непълна, „добавена по-късно"Генерирана заедно с кода (OpenAPI, README, CHANGELOG)
Audit trailGit historyGit + audit log в базата + CHANGELOG + Change Request
СкалиранеЛинейно (повече хора = по-висока цена на комуникация)Нелинейно (повече агенти = същият брой надзираващи хора)
Compliance (EU AI Act, GDPR, ISO 27001)Често външен одит постфактумВграден в процеса от първия ден

Често задавани въпроси

Какво е автоматизирана разработка на софтуер с ИИ?
Това е процес, в който специализирани ИИ агенти участват във всеки етап от жизнения цикъл на разработка на софтуер: от анализ на изискванията, през проектиране на архитектура, кодиране, автоматизирани тестове (unit, integration, E2E, security, performance, regression), до code review и продукционно внедряване. Хората все още надзирават процеса и вземат ключови решения, но рутинните задачи (писане на код, генериране на тестове, рефакторинг, документация) се изпълняват от ИИ агенти при запазване на договорените стандарти за качество.
Как този процес се различава от класическо програмиране с Copilot?
Copilot е autocomplete — помага да се пишат отделни редове код. Разработката на софтуер с ИИ е пълна оркестрация: един агент планира архитектурата, друг пише кода, трети пише тестовете, четвърти прави code review, пети деплойва. Всеки има собствена специализация, епизодична памет (учи се от предишни проекти), инструменти и контекст. Резултатът: значително по-голям мащаб на автоматизация в сравнение с единичен Copilot, при запазване на enterprise стандартите (тестове, сигурност, audit trail).
Какви типове тестове изпълнява този процес?
Всички видове тестове, които използват зрелите развойни екипи: unit, integration, end-to-end (E2E), UI (Playwright), security (OWASP Top 10, gitleaks), performance (load), regression, smoke и acceptance. Тестовете се пишат преди или паралелно с кода (TDD), а всяка промяна трябва да премине пълния пайплайн.
Дали ИИ деплойва код в продукция самостоятелно?
Не — не автоматично. Продукционните внедрявания изискват одобрен Change Request (CR) и решение на човек. ИИ агентите подготвят документацията на промените, изпълняват regression тестове, генерират deploy скриптове с план за rollback, но финалното пускане в продукция изисква одобрение от оператор. Това правило е целенасочено — минимизира риска от неочаквани последици и запазва пълен audit trail.
Работи ли този процес за enterprise проекти?
Да. Използваме го в собствените си продукти, включително мултиагентната платформа HybridCrew, консултантската платформа със SSO, микросервизи с PostgreSQL, интеграции с външни системи (KRS, MS Graph, IBM, Keycloak). Всеки проект има свой CI/CD пайплайн, dev/test/prod среди, мониторинг и audit log. Процесът скалира от единичен микросервиз до multi-container платформа.
Колко време отнема внедряването на този процес в нашата компания?
Зависи от контекста. За малък екип (1-3 разработчици) интеграцията със съществуващото хранилище и CI/CD пайплайн обикновено отнема 2-4 седмици: одит, конфигуриране на агентите, привеждане в съответствие със стандартите за кодиране, обучение. За по-големи организации пилотните проекти (един екип, един микросервиз) отнемат 6-8 седмици, последвани от постепенно разширяване към допълнителни екипи.
Какво за сигурността на изходния код?
Клиентските хранилища никога не напускат към външни услуги без изрично съгласие. По подразбиране целият процес (ИИ агенти, LLM модели, vector database, audit log) работи в инфраструктурата на клиента или в частния cloud на ESKOM AI с пълна изолация. Тайните се управляват през HashiCorp Vault, кодът се сканира с gitleaks преди всеки commit, а всички хранилища са частни по подразбиране.
Ще замените ли нашия развоен екип?
Не. Опитните разработчици са незаменими — те проектират архитектура, вземат решения, ревюират сложни промени, решават необичайни проблеми. ИИ агентите поемат повтарящите се, подходящи за автоматизация задачи: писане на boilerplate, генериране на тестове, документация, рефакторинг, code review от първо ниво. Целта: двама-трима души с ИИ доставят стойност на екип от 8-10 души — без прегаряне, с по-високо качество и пълен audit trail.
Колко струва разработката на софтуер с ИИ?
Цените са винаги индивидуални и зависят от мащаба, модела на разплащане (платформен абонамент vs. dedicated проект), необходимите интеграции, и дали агентите работят на локални LLM модели (Ollama на GPU на клиента — по-ниска оперативна цена) или в cloud (Anthropic, OpenAI — по-голяма гъвкавост). При пилотите целим възвръщаемост на инвестицията в първото тримесечие след пълно пускане.
Какви са типичните сигнали, че компанията е готова за този процес?
Най-добрите резултати идват от екипи, които вече имат: хранилище под версионен контрол (Git), дефинирани стандарти за кодиране, базов CI/CD пайплайн, ясно документирани изисквания (Jira/Linear/собствени) и култура на code review. Липсата на някой от тези елементи не блокира внедряването — започваме с одит и подготовка на основите. Най-слабо подготвени са организациите без версионен контрол или с продукционен код, който никой не тества.

Готови за пилотен проект?

Започваме с одит на съществуващия процес и пилот върху избран микросервиз. Първите резултати са видими за 2-4 седмици. Без дългосрочни ангажименти.