Pillar page
Разработка на софтуер с ИИ
Доказан процес за автоматизация на разработката на софтуер с екип от ИИ агенти — от анализ на изискванията, през кодиране и многослойни тестове (unit, integration, E2E, security, performance), до производствено внедряване с пълен audit trail.
Разполагаме с екип от специализирани ИИ агенти, който участва във всеки етап от жизнения цикъл на разработка на софтуер — от анализ на изискванията, през проектиране на архитектурата, кодиране и многослойни тестове, до code review, документация и внедряване с пълен audit trail.
Така изграждаме собствените продукти на ESKOM AI — мултиагентната платформа HybridCrew, системата за одити Compliance, микросервиза KRS+CRBR и портфолио от интеграции. Прилагаме същия процес и при клиентски проекти: както при изграждане на нови микросервизи, така и при модернизация на legacy системи.
Тази статия описва как това работи на практика: кои задачи поемат агентите, кои остават при хората, какви тестове изпълняваме и защо този процес е повторяем за различни типове проекти.
Защо да автоматизираме разработката на софтуер?
Класическият цикъл на разработка (анализ → код → тестове → review → deploy) в зрял екип обикновено отнема 2-4 седмици за функция със средна сложност. По-голямата част от това време отива за повтарящи се задачи: писане на boilerplate, генериране на unit тестове, преглед на промени, актуализация на документация, генериране на миграции на база данни. Всички подлежащи на автоматизация.
Целта на нашия процес е проста: двама-трима души с ИИ агенти доставят стойност, която по-рано осигуряваше екип от 8-10 души — без прегаряне, с по-високо качество (повече тестове, по-добър code review, пълна документация) и по-кратко time-to-market.
Това не е „ИИ ще замени програмистите". Това е „програмисти с ИИ ще заменят програмистите без ИИ". Опитните инженери остават незаменими — те проектират архитектурата, вземат стратегически решения, ревюират сложните промени. Агентите поемат рутината.
Шест етапа на процеса
Пайплайн от изискванията до продукцията. Всеки етап се изпълнява от специализирани ИИ агенти, а хората надзирават и одобряват ключовите решения.
Анализ на изискванията и архитектура
ИИ агентите анализират бизнес документация, разговори с клиента (от транскрипции), съществуващ код. Предлагат микросервизна архитектура, схема на базата данни, списък с endpoints, модел на разрешенията. Човек (CTO/архитект) ревюира и одобрява предложението преди започване на кодирането.
Писане на код (TDD)
Първо тестове, после имплементация. Backend агент пише API на FastAPI/Express, frontend агент пише React компоненти. Всяка промяна = отделен pull request с чисто commit съобщение. Стандартите за кодиране (Black, ESLint, Prettier) се налагат автоматично.
Многослойни тестове
Unit (pytest, Jest), integration (testcontainers с реален PostgreSQL), E2E (Playwright), UI snapshot, security (OWASP, gitleaks, bandit), performance (k6/locust), accessibility (axe). Всеки PR минава през пълния пайплайн — провален тест блокира merge.
Code review с ИИ
Агент SecurityReviewer сканира за OWASP Top 10, агент QualityReviewer проверява четливост и патерни, агент ArchitectureReviewer верифицира съгласуваност с останалата част от системата. Граничните случаи се ескалират към хора.
Документация и CHANGELOG
Всяка промяна в логиката = bump на версията + запис в CHANGELOG.md във формат Keep a Changelog. API документация (OpenAPI/Swagger) се генерира автоматично. CLAUDE.md се актуализира след всяка сесия с новонаучени уроци.
Внедряване с Change Request
Deploy винаги през Git (НИКОГА директен scp). Първо тестова среда с верификация чрез Playwright, после продукция след одобрение на CR. Deploy скриптът включва план за rollback (<5 мин) и health checks.
Какво печели компанията?
Хиляди автоматизирани тестове
Всеки продукционен проект има от няколко хиляди до десетки хиляди тестове — unit, integration, E2E, security, performance. Регресиите се хващат в CI преди да стигнат до потребителите.
Пълен audit trail
Всяка промяна в код, база данни или конфигурация е записана: Git, audit log в базата, CHANGELOG, Change Request. Отговаря на изискванията на ISO 27001, EU AI Act и GDPR.
Скалируемост на екипа
Двама-трима души с ИИ агенти доставят стойност на екип от 8-10 души. Без прегаряне, с по-високо качество и по-кратки срокове.
Ескалация към по-силни модели
LLM routing избира правилния модел за всяка задача: малки промени — локален Ollama (нулева цена), сложна архитектура — Claude Opus. Оптимизация на цена и качество в едно.
Повторяемост и стандарти
Всеки проект следва същите стандарти: feature branch workflow, squash merge, Conventional Commits, CHANGELOG, EU AI Act, GDPR. Нов разработчик разбира структурата за един ден.
Сигурност по подразбиране
Gitleaks на pre-commit + CI, тайни в HashiCorp Vault, частни хранилища, Keycloak SSO, Tailscale VPN за вътрешни услуги. Без компромиси за сметка на скоростта.
Многослойни тестове — фундаментът на качеството
Всяка промяна в продукционен код минава през пълен тестов пайплайн. Без изключения — дори поправяне на typo в коментар стартира CI, защото тестовият пайплайн се налага от Git hook, а не от политическо решение на разработчик.
- Unit тестове: pytest, Jest, vitest. Покриват отделни функции и класове. >80% покритие за критичен код.
- Integration тестове: testcontainers с реални инстанции на PostgreSQL, Redis, Vault. Mock-ове само за външни third-party API.
- End-to-end (E2E) тестове: Playwright във Firefox (по подразбиране), Chrome (опционално). Симулират пълни потребителски пътеки: login → действие → верификация.
- UI тестове (snapshot, accessibility): Playwright + axe-core. WCAG 2.0 AA като baseline, Lighthouse 100/100/100/100 като цел.
- Security тестове: OWASP Top 10 (semgrep, bandit, eslint-plugin-security), gitleaks (сканиране на тайни на pre-commit и CI), trivy (сканиране на Docker образи).
- Performance тестове: k6 или locust за load тестове, проверка на p95/p99 response time под натоварване.
- Regression тестове: пълният suite се изпълнява преди всеки продукционен deploy. Всеки докладван bug става regression тест.
- Smoke тестове: минимален набор от 5-10 теста, изпълнявани след продукционния deploy (дали приложението изобщо е стартирало).
- Acceptance тестове: бизнес тестове (Cucumber/Gherkin), потвърждаващи, че изискването е изпълнено.
Провален тест = блокиран merge. Без изключения. Ако тестът е „flaky" (нестабилен), диагностичен агент анализира първопричината и поправя теста или кода, но никога не премахва тест без решение на човек.
Типични сценарии
Шаблоните, които прилагаме най-често. Всеки идва със собствен набор от агенти, инструменти и шаблони. Time-to-value измерено в седмици, не в месеци.
Модернизация на legacy системи
- •Старо монолитно приложение (PHP/.NET, без тестове, трудно за поддръжка)
- •Агентите разделят монолита на микросервизи (инкрементално, без downtime)
- •Генерират характеризиращи тестове (захващащи текущото поведение) преди рефакторинг
- •Миграция на данни с пълен audit trail и план за rollback
Нов enterprise микросервиз
- •Спецификация на вход (Jira ticket, PRD, транскрипция от среща)
- •Архитектура → код → тестове → review → deploy за 2-3 седмици
- •Интеграция със съществуващо SSO (Keycloak), audit log, мониторинг
- •Пълно съответствие с EU AI Act и GDPR от първия ден
Системна интеграция
- •Свързване на ERP, CRM, KRS, Microsoft Graph, IBM, Cisco, външни партньори
- •Агентите пишат адаптери, мапинги, retry/backoff, идемпотентност
- •Integration тестове на реални endpoints (sandbox API)
- •Мониторинг (Prometheus + Grafana) и алерти (Sentry) свързани автоматично
Multi-tenant платформи
- •Multi-client SaaS с пълна изолация на данни (per-tenant schema или row-level security)
- •Автоматизиран onboarding на клиенти (Keycloak provisioning, база данни, роли)
- •Билинг базиран на SSO Billing SDK (token usage tracking, fail-open)
- •Compliance: GDPR, ISO 27001, EU AI Act готови за одит
Сравнение: класически екип vs. процес с ИИ
| Аспект | Класически екип (8-10 души) | Екип с ИИ агенти (2-3 души) |
|---|---|---|
| Time-to-market (средна функция) | 2-4 седмици | 3-7 дни |
| Покритие с тестове | 40-60% (когато екипът има време) | >80% по подразбиране (тестовете се генерират заедно с кода) |
| Code review | 1 човек, средно 30-60 мин | 3 агента (security, quality, architecture) + човек при сложни промени |
| Документация | Често непълна, „добавена по-късно" | Генерирана заедно с кода (OpenAPI, README, CHANGELOG) |
| Audit trail | Git history | Git + audit log в базата + CHANGELOG + Change Request |
| Скалиране | Линейно (повече хора = по-висока цена на комуникация) | Нелинейно (повече агенти = същият брой надзираващи хора) |
| Compliance (EU AI Act, GDPR, ISO 27001) | Често външен одит постфактум | Вграден в процеса от първия ден |
Често задавани въпроси
Какво е автоматизирана разработка на софтуер с ИИ?
Как този процес се различава от класическо програмиране с Copilot?
Какви типове тестове изпълнява този процес?
Дали ИИ деплойва код в продукция самостоятелно?
Работи ли този процес за enterprise проекти?
Колко време отнема внедряването на този процес в нашата компания?
Какво за сигурността на изходния код?
Ще замените ли нашия развоен екип?
Колко струва разработката на софтуер с ИИ?
Какви са типичните сигнали, че компанията е готова за този процес?
Готови за пилотен проект?
Започваме с одит на съществуващия процес и пилот върху избран микросервиз. Първите резултати са видими за 2-4 седмици. Без дългосрочни ангажименти.