DuploCloud спонсировал этот пост.
Сейчас 2:47 ночи. Ваш телефон гудит. Производственные оповещения. Служба оформления заказа выдает ошибки 5xx, клиенты бросают тележки, а дежурный инженер переключается между Datadog, Argo CD, kubectl и журналами. Она просто пытается понять, что изменилось. Задержка выросла 20 минут назад. Развертывание началось в 2:31 ночи.
Два модуля находятся в CrashLoopBackOff. Изменены ограничения памяти. Она откатывается, обновляет билет, пишет вскрытие и… пытается снова заснуть. И все же она знает, что на следующей неделе ей придется снова пережить какую-то версию этого.
Тем временем ее коллега провела рефакторинг целого модуля в Cursor за считанные минуты благодаря ИИ. ИИ разобрался в кодовой базе, предложил изменения и выполнил утомительные части. И все это делалось автоматически.
Что случилось?
ИИ изменил то, как мы пишем код. Но это не изменило то, как мы управляем инфраструктурой для запуска этого кода.
Разрыв продолжает увеличиваться
За последние два года ИИ изменил способ работы разработчиков:
- Cursor и Copilot пишут и рефакторят код.
- Такие инструменты, как Lovable, v0 и Bolt, создают интерфейсы.
- Агенты Replit формируют и развертывают полные приложения.
Но работа DevOps остается ручной. Инженерам по-прежнему приходится устранять инциденты путем:
- Копирование из книг Runbook
- Переключение между инструментами
- Опираясь на племенные знания
- Обновление инфраструктуры как кода (IaC)
Инциденты по-прежнему тормозят выпуск релизов. Отставание по-прежнему растет.
ИИ ускорил развитие, в то время как операционная деятельность осталась в тупике. Это не надзор за рынком. Эта проблема намного, намного сложнее.
Почему операционная инфраструктура так сильно отличается 1. Нет буфера для ошибок
Предложение плохого кода не работает в ветке. Плохое изменение инфраструктуры немедленно отразится на реальном трафике.
У каждого действия в DevOps есть свой радиус взрыва: поды умирают, группы безопасности разрывают соединение, а конвейеры вызывают каскад сбоев.
2. Поверхность контекста огромна
ИИ для DevOps должен синтезировать:
- Производство против разработки
- Состояние Кубернетеса
- Репозитории кода для Terraform/Infrastructure as Code.
- CI/CD рус
- Сигналы наблюдаемости
- Конфигурация облачного провайдера
- Данные о затратах
- Ограничения соответствия
Таким образом, вашим помощникам по коду понадобятся только файл и его соседи. При использовании DevOps вам необходимо иметь представление обо всем стеке.
3. Каждая среда уникальна
Не существует универсальной модели, определяющей форму вашей инфраструктуры. У каждой компании есть собственные модули terraform, собственные конвейеры, стратегии развертывания, правила оповещений и логика информационной панели. Обычный ИИ просто не может работать безопасно.
4. Управление является обязательным
Реальные требования к инфраструктуре:
- Управление доступом на основе ролей (RBAC)
- Разрешения
- Журналы аудита
- Доказательства соответствия
Ни один ИИ не может обойти эти процессы. Он должен иметь возможность интегрироваться с ними.
Почему существующие инструменты не оправдывают ожиданий
Это тяжело. Многие продукты решают отдельные части проблемы:
- автоматизация Runbook выполняет предопределенные сценарии.
- Групповые оповещения платформ AIOps.
- Инструменты наблюдения диагностируют аномалии.
- Инструменты управления инцидентами маршрутизируют и повышают уровень реагирования.
- Вторые пилоты кодирования помогают вносить изменения в IaC
Конечно. Все это полезно. Но ни один из них не работает так же, как Cursor для кода приложения.
Каким должен быть «курсор для DevOps»
Чтобы Cursor для DevOps работал, вам необходимо иметь несколько вещей:
Он должен работать внутри вашего облака
Инфраструктура и данные чувствительны. Жизнеспособная система должна располагаться в виртуальном частном облаке клиента, использовать управление идентификацией и доступом и полагаться на собственные облачные модели большого языка (LLM), такие как Amazon Bedrock.
Требуется единый уровень оркестрации
IaC, Kubernetes, CI/CD, наблюдаемость, стоимость и соответствие требованиям — все это разные области, верно? ИИ нужен координатор, который сможет справиться с:
- Личность
- Совместное использование контекста
- Интеграция инструментов
- Многоэтапные рабочие процессы
- Инфраструктура как код
Вам понадобится хорошо спроектированная система «человек в цикле»
Вот пошаговый процесс:
Только так производство может работать хорошо.
Собственный RBAC необходим
Агенты должны иметь возможность наследовать точные разрешения людей, которых они представляют. И подъем должен прибыть как раз вовремя.
Специализированные агенты с глубокими знаниями – ключ к успеху
Вам не нужна одна гигантская модель. Вам нужны специализированные агенты, такие как:
- Агент Кубернетеса
- CI/CD-агент
- Агент наблюдения
- Комплаенс-агент
- Агент по оптимизации затрат
- Код интегрированных агентов IDE
Каждый из них имеет глубокие знания в своей области. И это единый уровень оркестровки, который связывает их вместе. Инфраструктура имеет множество отдельных проблем, и вам нужны агенты, специализирующиеся на Kubernetes, CI/CD, наблюдаемости, соблюдении требований и управлении затратами. Эти агенты принимают более разумные решения и остаются ближе к реальной работе DevOps. Они также могут работать вместе: один агент может отметить проблему, другой может исправить ее, внося изменения в конфигурацию или код, а третий может проверить ее, поэтому сложные рабочие процессы обрабатываются правильно.
Первые результаты показывают путь вперед
Мы были свидетелями того, как команды пилотировали эти архитектуры. Они уже видят:
- Сокращение MTTR на 40–70 процентов
- Объемы продажи билетов резко падают
- Циклы подготовки сокращаются с недель до часов
- Автоматические доказательства и непрерывные контрольные проверки
Эти преимущества связаны с тем, что ИИ может выполнять предсказуемую работу. Таким образом, у вас больше нет изнуренных команд DevOps. Теперь ИИ может анализировать сигналы, распознавать известные закономерности, выполнять утвержденные исправления, обеспечивать среду и незаметно собирать данные аудита. Цель не в том, чтобы заменить инженеров. Цель состоит в том, чтобы дать им рычаги влияния.
Наступает момент курсора
Нет, сложность инфраструктуры не изменилась. Но возможности ИИ есть. В настоящее время существуют архитектурные шаблоны для безопасного применения ИИ как при разработке, так и при эксплуатации.
В течение следующих 18 месяцев мы обязательно увидим:
- Улучшенная межагентная оркестровка
- Более глубокая интеграция инструментов
- Более богатые контекстуальные рассуждения
- Более плавное согласование с существующими рабочими процессами
- Прекрасный опыт программирования IaC.
DevOps дождался своего момента Cursor, и ингредиенты наконец-то готовы.
Мы создаем AI DevOps Engineer в DuploCloud, чтобы вы получили AI-агенты, которые: работают внутри вашего облака, понимают вашу инфраструктуру, выполняют реальные задачи DevOps со встроенными функциями управления и соответствия требованиям, а также помогают писать и запускать ваш IaC. Узнайте больше об инженере DuploCloud AI DevOps.
DuploCloud предлагает программную платформу DevSecOps для команд, у которых нет выделенного DevOps, и дополняет те, у которых есть. Платформа автоматизирует предоставление вашего приложения в облако (AWS, GCP, Azure), интегрируя облачные операции, SecOps, а также безопасность/соответствие требованиям с круглосуточным мониторингом и поддержкой. Узнайте больше Последние новости от DuploCloud ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Зафар Аббас — технический директор DuploCloud, а ранее занимал должность вице-президента по разработке в Juul Labs и Zenefits, руководя командами по электронной коммерции, расчету заработной платы, платформам и инфраструктуре. Он увлечен разработкой великолепных продуктов и расширением возможностей высокопроизводительных команд. Узнайте больше от Зафара Аббаса