Pagerduty спонсировал этот пост.
Современные ИТ -команды находятся под давлением, чтобы минимизировать время простоя и постоянно улучшать управление операциями, но инструменты, которые они дают, для достижения своих целей часто терпят неудачу, даже если они позволяют автоматизировать обычные задачи.
На базовом уровне организации могут улучшить конвейер управления операциями, используя отдельные агенты искусственного интеллекта для выполнения простых задач и предлагать альтернативные варианты, если известные исправления не работают. Агенты ИИ также могут выходить далеко за рамки этого, действуя автономно в сети агентов, приближающихся к системам самовосстановления.
Агенты искусственного интеллекта в настоящее время используются многими организациями, причем один опрос обнаруживает, что более половины уже развернули агенты ИИ. Тем не менее, многоагентные системы ИИ дают представление о будущем операций. Эти сети агентов — в отличие от отдельных агентов, действующих автономно для отдельных процессов — обеспечивают сотрудничество между инструментами искусственного интеллекта для диагностики и решения проблем с ИТ в режиме реального времени.
Многоагентные системы ИИ могут позволить значительные улучшения существующих процессов в жизненном цикле управления операциями. От интеллектуальных билетов и сортировки до автономной отладки и упреждающего обслуживания инфраструктуры, эти системы могут проложить путь для ИТ-сред, которые в значительной степени самовосстанавливаются. В конце концов, необходимость вмешательства человека может быть ограничена только случаями, когда их опыт необходим, помогая поддерживать бизнес в Интернете и внедрять постоянные инновации для своих клиентов.
Чтобы реализовать этот потенциал, организации должны сосредоточиться на трех ключевых этапах-диагностике, восстановлении и непрерывном обучении-чтобы постепенно строить к самовосстанавливающейся среде ИТ.
Диагноз
Агенты ИИ в управлении операциями значительно ускорят диагностику инцидентов. Расследование и диагноз инцидентов-это многоэтажный, многоэтажный процесс, в котором отправной точкой часто является единственным инцидентом, который может быть чрезвычайно трудным, особенно в том, что правила создают короткие сроки отчетности для организаций.
В Европе ЕС запустил Директиву NIS2 и Закон о цифровой оперативной устойчивости (DORA), а в Великобритании законопроект о кибербезопасности и устойчивости выйдет в конце этого года. Все эти правила требуют, чтобы организации повышали цифровую операционную устойчивость, и это чрезвычайно трудно достичь при работе вручную.
На этом начальном этапе управления операциями можно развернуть сеть агентов ИИ, чтобы сортировать проблему, оценить тяжесть инцидента и потенциальный радиус взрыва и обострить ее по мере необходимости. Агенты ИИ могут понимать текущие билеты на поддержку, а также какие услуги напрямую затронуты в инциденте.
Работая в сети и с более расширенными возможностями рассуждений, эти агенты также могут определить, какие услуги зависят от других, и предоставить дополнительную потребность в контексте человека.
Системы агентов по искусственному искусству позволяют человеческим респондентам использовать интеллектуальную автоматизацию для обнаружения и сортировки инцидентов, в зависимости от их серьезности и существует ли известное исправление. На стадии сортировки агент AI способен выполнять диагностику — такую как ошибки применения, вычислительные ресурсы, такие как процессор или память, или собирать журналы и трассировки — для ответчиков, чтобы исключить типичные, повторяющиеся проблемы.
Исправление
После стадии идентификации сеть агентов искусственного интеллекта может принести значительные улучшения в восстановлении инцидентов. Когда инцидент обнаружен, агенты искусственного интеллекта могут попытаться отлаживать проблемы с известными исправлениями, используя информацию о прошлых инцидентах. Когда в сети объединяются несколько агентов, они могут разрабатывать альтернативные решения, если первоначальные усилия по восстановлению не работают, одновременно передавая текущий процесс с инженерами.
Сохранение человека в цикле (HITL) жизненно важно для проверки выходов модели ИИ, но агентам необходимо доверять для автономно работать в системе для определения исправлений, а затем сообщить об этом обратно инженерам.
В сети агенты искусственного интеллекта имеют достаточно исторических данных, чтобы понять, как разрешить инциденты и когда обострить проблему для человеческого респондента. Агенты ИИ могут даже предложить резолюцию для человека, а затем, если его принят, предпринять автономные действия, позволяя человеку действовать в качестве посредника и проверить результаты модели.
Сочетая подход HITL с автономными агентами ИИ, организации могут итеративно улучшить свои процессы управления операциями и больше перейти к агентским моделям и ближе к системе самовосстановления.
Обучение
Наиболее важным шагом в создании системы самовосстановления является обучение агентов ИИ, чтобы иметь возможность учиться на каждом инциденте, а также друг от друга, чтобы стать по-настоящему автономными.
Чтобы это произошло, агенты искусственного интеллекта не могут быть залиты в ответ инцидента. Вместо этого они должны быть включены в более широкую систему организации, общаться со сторонними агентами и позволять им наносить корреляции из каждого действия, предпринятого для разрешения каждого инцидента. Таким образом, история инцидентов каждой организации становится данными обучения для своих агентов искусственного интеллекта, гарантируя, что действия, которые они предпринимают, будут специфичными для организации и актуальны.
Со временем агенты ИИ могут определить успешные модели управления операциями и соответствующим образом скорректировать свои стратегии. Система, которая действительно самовосстанавливается, создается, позволяющая инженерам доверять своим агентам искусственного интеллекта разрешать простые, повторяющиеся инциденты и только эскалация высоких или новых исправлений для человека.
Доверяйте агентам ИИ лечить ваши системы
С тех пор, как начался последний цикл AI Hype, организации изо всех сил пытались получить истинную отдачу от инвестиций (ROI) от ИИ. Хотя генеративные инструменты ИИ хороши для суммирования и создания контента, они не предлагают преобразующие преимущества, которые могут агенты ИИ.
Агенты ИИ будут полностью изменить способ, которым инженеры могут провести свое рабочее время. От борьбы с пожарами и часами тратя часами по вызову и в военных комнатах, инженеры вместо этого смогут сосредоточиться на вождении инноваций и улучшении услуг, доверяя агентам ИИ для управления трудом устранения инцидентов.
Способность перейти на систему самовосстановления для управления операциями, где люди приносятся только в случае необходимости, является истинной рентабельностью агентов ИИ. Эта новая парадигма для операций может переключить время простоя системы до нуля, при этом резко улучшая повседневные работы инженеров.
Modern Enterprises Trust PageRduty для управления цифровыми операциями, включая реагирование на инциденты, AIOPS, автоматизацию процессов и CSOPS. Благодаря облачному облаку Pagerduty Operations организации могут сжать затраты, ускорить производительность и поддерживать бесшовные цифровые впечатления. Узнайте больше последних из Pagerduty Trending Stories YouTube.com/thenewstack Tech, быстро движется, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Жуао Фрейтас является генеральным директором и инженерным руководителем для ИИ в Pagerduty. Имея около 20 -летнего опыта в области разработки программного обеспечения, машинного обучения и как менеджер по людям, он ранее был техническим директором в стартапе ИИ и получил несколько … Подробнее от Жуао Фрейтас