Pagerduty спонсировал этот пост.
Мы полагаемся больше, чем когда -либо на цифровые технологии для услуг, которые мы используем ежедневно. В то же время, эти услуги испытывают более частые сбои, поскольку инциденты, затрагивающие клиентов, увеличивают 12,5% года в год.
Инциденты обычно начинаются с неисправного толчка, кибератаки или промежутка в цифровой сантехнике. А регуляторы? Они определенно заметили всплеск перебоев. В ответ они разрабатывают больше правил для повышения устойчивости, потому что, когда основные услуги, такие как банковское дело, образование или здравоохранение. Один отключение может быстро снежный ком, снимая другие критические системы, которые работают на тех же технологических фондах.
В Европе ЕС запустил Директиву NIS2 и Закон о цифровой оперативной устойчивости (DORA), а в Великобритании новый законопроект о кибербезопасности и устойчивости будет предстоящим позже в 2025 году. Общим с тем, что эти правила являются требованием, чтобы организации повысили цифровую оперативную устойчивость, включая внедрение строгих процессов для инцидентов отчетности.
Тем не менее, внедрение необходимых процессов создает значительные проблемы.
Вручную, чтобы собрать информацию, необходимую для сообщений об инциденте в сложном технологическом стеке, не является легким подвигом, особенно когда первоначальный отчет должен быть представлен в течение 24 часов после возникновения инцидента, как и в Директиве NIS2 и законопроект Великобритании по кибербезопасности и устойчивости.
Для этих правил организациям предоставляется 28 дней для представления расследовательного отчета, состоящего из нескольких элементов, включая анализ основной причины, следу аудита, документацию о действиях и коммуникациях, оценку воздействия и руководство о том, как будут избегать будущих инцидентов.
Регуляторы также становятся менее терпеливыми. Для инцидентов, обнаруженных, оказывают значительное влияние, определяемое директивой NIS2 как «способную вызовать серьезные операционные нарушения услуг или финансовых потерь», — регулирующие органы могут потребовать полного отчета о расследовании, который будет предоставлен в течение одного месяца, а также промежуточные отчеты, по запросу, когда продолжается влияние инцидента.
Единственный способ, которым организации могут идти в ногу и оставаться устойчивыми,-это опираться на цифровые операции, управляемые автоматизацией, на одной единой платформе. Жонглирование фрагментированными инструментами просто больше не разрезает его.
Вот пять способов, которыми унифицированный подход позволяет ИТ и цифровым командам поддерживать соответствие и повысить эксплуатационную устойчивость.
1. Упростить владение услугами и уменьшить ручной труд
Унифицированная платформа делает владение услугами нелегкой, непосредственно подключая критические услуги с нужными респондентами, поэтому нет никакого борьбы, когда дела идут вбок. Команды могут быстро и в масштабе, облегчая облегчение импульса в реальном времени на здоровье системы и увидеть, насколько далеко распространяется урон, когда что-то ломается. Вместо того, чтобы преследовать данные по дюжине инструментов мониторинга, все централизовано в одном месте для легкого анализа. Благодаря автоматизации, обрабатывающей утомительную диагностику, команды могут тратить меньше времени на ручную работу и больше времени, фактически решая проблему.
2. Включить быстрое, точное отчетность и обмен информацией
С учетом того, что все данные, централизованные в унифицированной платформе, классификация и отчетность инцидентов намного проще с доступными и подробными журналами инцидентов, которые обеспечивают четкий аудиторский след. Сложные платформы также интегрируются с инструментами управления ИТ -услугами (ITSM) и ИТ -операций (ITOPS) для упрощения отчетности инцидентов на основе предопределенных критериев. Давление, обычно оказываемое на респондентов, дополнительно поднимается с помощью автоматизированных книг для быстрых отчетов и генеративных возможностей ИИ, которые могут создавать обновления статуса для общественных страниц, связанных с инцидентом.
3. Последовательное тестирование на устойчивости и обучение
Каждый инцидент, как реальный, так и смоделированный, должен рассматриваться как возможность обучения. Агрегация данных из разрозненных инструментов в одно местоположение дает командам полную картину того, как были затронуты операции их организации, и дает повествование для отчетности. Затем команды могут раскрыть шаблоны по инструментам, командам и времени для обучения непрерывного обучения в пост-инцидентских обзорах. В сочетании с регулярным, автоматизированным тестированием брусков аварийного восстановления команды могут укрепить уверенность в устойчивости своей системы.
4. Увеличьте видимость во внешних партнерских рисках
Организации должны знать о рисках, связанных с критическими сторонними поставщиками (CTTP) для соответствия. Если CTTP, подобный поставщику облаков, подрядчик по кибербезопасности или провайдер хостинга данных испытывает свой собственный инцидент, последствия для организации — от потери данных до разрушения оперативного действия — могут быть серьезными. Унифицированная платформа управления цифровыми операциями снижает риск за счет быстрой категоризации и отчетности инцидентов со стороны поставщика исходного происхождения, поэтому организации сохраняют надзор. Благодаря встроенному автоматическому тестированию команды также могут проверить доступность и качество обслуживания CTTPS для знаков раннего предупреждения.
5. Утешительную документацию и управление записями
Сохранение подробных записей — это не просто поле для соответствия для проверки. Это спасатель, когда аудиты катятся. Унифицированная платформа, которая синхронизирует в обоих направлениях с инструментами управления ИТ -услугами и хорошо играет с командами Slack и Microsoft, означает, что каждый ответ и разговор автоматически регистрируется (больше не копирует и вставьте заметки в 2 часа ночи). Это делает встречу как в режиме реального времени, так и в последующих требованиях к отчетности ветеркой. Кроме того, встроенный ИИ может суммировать ключевые действия и чаты, чтобы команды могли быстро обновлять EXC и партнеров, не просеивая бесконечные потоки сообщений.
Построение готовности регулирования
Организации должны оставаться впереди кривой (и регулирующих органов), чтобы не отставать от входящих правил и правил. Ключом к успеху является вооружение его и цифровые команды с данными под рукой, чтобы они могли реагировать на регуляторы на молнии. Задача для организаций заключается в том, что инфраструктура, поддерживающая критические цифровые услуги, стала гораздо сложнее для управления и защиты.
Единственный реальный способ оставаться готовым к регулированию в этом высоком уровне, высоком мире,-это объединенная платформа, которая выпекает ИИ и автоматизацию непосредственно в операции. Потому что, когда дело доходит до соответствия, в последней минуте — не стратегия. Это катастрофа, ожидающая, чтобы случиться.
Modern Enterprises Trust PageRduty для управления цифровыми операциями, включая реагирование на инциденты, AIOPS, автоматизацию процессов и CSOPS. Благодаря облачному облаку Pagerduty Operations организации могут сжать затраты, ускорить производительность и поддерживать бесшовные цифровые впечатления. Узнайте больше последних из Pagerduty Trending Stories YouTube.com/thenewstack Tech, быстро движется, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Джозеф Мандрос — менеджер по маркетингу продуктов в Pagerduty. До Pagerduty он работал в разработке учетных записей предприятия в Coreos и был представителем по развитию продаж в Everstring. Он имеет степень бакалавра в области бизнеса/управленческой экономики в Университете … Подробнее от Джозефа Мандроса