Хроносфера спонсировала этот пост.
Для Эшли, директора по наблюдению в многонациональном производителе электроники, отсутствие ввода и понимания о наблюдаемости в ее организации угрожает сорвать инициативу Организации по наблюдению. Ее компания недавно приняла современный инструмент наблюдения после перехода от монолитных предприятий, работающих на виртуальных машинах к распределенным контейнерным микросервисам с независимыми циклами высвобождения. Цель компании в принятии нативной наблюдаемости облака состояла в том, чтобы обеспечить стабильность приложений и положительный опыт клиентов. Тем не менее, отсутствие консенсуса в отношении наблюдаемости оставило инженеров, и, в конечном счете, клиенты, хуже, чем раньше.
Эшли-вымышленный персонаж в выдуманной виньетке, предназначенной для иллюстрации того, как культура наблюдаемости или ее отсутствие может добиться или сломать успех компании. То, что происходит в мире Эшли, на самом деле происходит в организациях по всему миру, каждый день. Когда культура наблюдения является дисфункциональной, запуски продукта ухабистые — или даже сбой — потому что ключевые системы остаются незамеченными, а видимость ограничена.
Потребность в комплексных инструментах по всем направлениям очевидна: вместо того, чтобы тратить время на инновации и поиск новых способов сделать клиентов счастливыми, команды инженеров сосредоточены на вопросах устранения неполадок.
Взгляд на инцидент в организации Эшли может дать вам представление о том, как плохая жизнь, когда инструмент наблюдения не используется с наибольшим эффектом и как может помочь культура наблюдаемости. Эта виньетка, в которой инцидент с трудностями в разрешении угрожает отложить крупный запуск продукта, проиллюстрирует:
- Как организации могут построить культуру наблюдаемости
- Важность взаимодействия с заинтересованными сторонами
- Действенные шаги для обеспечения наблюдения становятся основополагающим элементом вашего процесса разработки
Билл Хинелин, который видел что -то или две вещи в течение 17 лет в качестве директора по наблюдаемости предприятия в United Airlines, добавит некоторую информацию. Хинелин в настоящее время является техническим директором в хроносфере.
Теперь давайте зарегистрируемся на Эшли:
После быстрого обеда (или ужинать сейчас?), Эшли воссоединяется с помощью ответа на инцидент, чтобы зарегистрироваться с командой. Будучи директором по наблюдению, Эшли большая заинтересованность в том, чтобы этот инцидент был быстро разрешился. Предполагается, что запуск продукта произойдет через два дня, но эта ошибка нарушила ключевую часть потока дохода через приложение.
Обсуждение по вызову вращается вокруг отсутствия видимости в пару ключевых микросервисов: Shopping Cart и Checkout.
Зная, что инструмент наблюдений нуждается в правильном инструментах, чтобы помочь диагностировать проблему, Эшли спрашивает: «Мы вложили в инструмент для метрик и отслеживание телеметрии для этих услуг?» Она смотрит непосредственно на Константина, ведущего разработчика одной из услуг.
Константин спрашивает: «Вы шутите? У нас едва было время получить написанный базовый код. Написание в инструментах всегда было ниже в нашем списке приоритетов».
В комнате существует напряжение, так как давление накапливается, чтобы быстро решить проблему и поддерживать запуск продукта на пути, несмотря на то, что не знает, в чем причина.
«Но этот вызов доказывает, что именно поэтому нам нужно иметь такую инструментацию. У нас есть платформа наблюдения, которая может дать нам видимость для устранения проблемы проблемы, но только если все инструментально. Распределенная трассировка не работает, если в данных есть отверстия», — говорит Эшли.
Ашиш, вице-президент по инфраструктуре, который до сих пор был вне камеры и молчал, появляется на камеру и говорит: «Честно говоря, нам нужно найти лучший и более быстрый способ разрешения этих инцидентов. Эта платформа для наблюдения стоит нам руку и ногу, и она явно не обеспечивает необходимую ценность. Давайте потянут некоторые инженеры из Phoenix и получит больше гостей в этом.
Эшли убивает камеру и кладет голову в руки. «Они просто не понимают», — думает она себе — и открывает свое резюме.
Что пошло не так?
Эшли борется с тем фактом, что ее члены команды и заинтересованные стороны, похоже, не понимают ценность и цель наблюдения. Константин рассматривает наблюдение как нечто, что требует времени, а не то, что экономит время. Ашиш видит в этом центр затрат, а не центр стоимости. Они оба хотят продолжать делать все привычно.
Эшли не одинока. Мы часто видим это в организациях всех размеров.
Чтобы наблюдать, чтобы действительно обеспечить преимущество, которую она обещает, он должен иметь вклад в каждую часть организации. От развития до операций до руководства, должно быть общее понимание того, как может помочь наблюдаемость и почему это важно. Культура наблюдаемости должна проникать в организацию.
Что такое культура наблюдаемости?
Фундаментальный к успеху стратегии наблюдаемой стратегии является способность установить культуру наблюдаемости в более широкой организации. Культура наблюдаемости можно характеризоваться тремя признаками:
1) Общая ответственность и бай-индекс:
Успешная стратегия наблюдаемости требует стимулирования культуры общей ответственности за наблюдаемость во всех командах. Внедряя наблюдение на протяжении всего жизненного цикла разработки программного обеспечения, организации создают упреждающую среду, в которой проблемы обнаруживаются и решаются на ранней стадии. Это потребует наблюдения за всеми командами в организации.
2) Продвижение прозрачности:
Команды, которые определяют приоритеты наблюдения, получают более глубокое представление о производительности системы и опыте пользователей, что приводит к более быстрому разрешению инцидентов и улучшению предоставления услуг. Содействие организационному мышлению, которое оценивает прозрачность и непрерывный мониторинг, является ключевым.
3) Сдвиг слева:
Сдвиг наблюдаемость, оставленная в процесс разработки, помогает командам ранее улавливать проблемы, снижая стоимость исправления ошибок и повышения качества продукта. Разработчики могут с самого начала интегрировать наблюдаемость в код, обеспечивая, чтобы системы были инструментами и контролируются на каждом этапе. Это ключевой шаг к созданию культуры наблюдаемой.
«Вы не можете приспособиться к наблюдению в конце и ожидать, что она будет работать.
— Билл Хинелин, технический директор Chronosphere Field и бывший директор Enterprise Observicability для United Airlines
Выявление заинтересованных сторон и организационную собственность
В качестве ключевого шага в пути построения культуры наблюдаемости, вам необходимо убедиться, что у вас есть организационное участие в усилиях и полученной стратегии.
Некоторые вопросы, которые нужно задать себе в этом отношении:
- Кто отвечает за стратегию наблюдения?
- Кому владеет выполнение наблюдаемости?
- Существует ли центральная команда по наблюдению, или ответственность распределена с бизнес -подразделениями или проектными командами?
- Где сидит право собственности на эту стратегию? В рамках платформы? Сайт надежности инженерия (SRE)? ОПС? В другом месте?
Затем вам необходимо рассмотреть (и привлекать) всех ключевых игроков и заинтересованных сторон по всей организации, которые должны покупать и участвовать.
Это должно включать:
- Исполнительное спонсорство
- Инженерное руководство
- Ключевые пользователи, в том числе те, которые являются экспертами, и те, которые могут только редко использовать эти системы
- Администраторы инструментов наблюдения
- Закупки и финансы, потому что стоимость может стать проблемой
- Любые другие бизнес -подразделения, которые могут захотеть за столом места
Большая часть заключается в том, чтобы убедиться, что все заинтересованные стороны по всей организации, будь то высокие или низкие в таблице организации, понимали, что происходит. Это означает получение обратной связи. Лидерство должно быть вовлечено. Это означает, что вы делаете то, что вы делаете, почему вы это делаете и каковы последствия, которые делают или не делаете этого.
Кроме того, вам нужно определить, кто будет вашим чемпионам, а кто может быть хулителями. Обе группы одинаково важны для вашей стратегии наблюдения и требуют равного внимания.
- Недоброжелатели могут обогнать повествование и уменьшить достижение, которое вы пытаетесь достичь.
- Чемпионы, однако, могут помочь завоевать дополнительные заинтересованные стороны, пользователей и даже хулители, чтобы увеличить участие в вашей стратегии.
Убедитесь, что чемпионы услышаны и одновременно используют свою силу, чтобы помочь команде, как минимум, принять изменение и понимает, что вам нужно от них. Кроме того, вы можете использовать чемпионов, чтобы выиграть хулителей, заставив их продемонстрировать преимущества стратегии наблюдения. Это может произойти в индивидуальных разговорах и в команде более широко.
«Если наблюдаемость рассматривается как нишевый инструмент или проблему команды, она потерпит неудачу. Успех достигнут, когда лидеры по проектированию, продукту и инфраструктуре признают, что наблюдаемость является основополагающей для обеспечения великого опыта клиентов — и обязуются его вместе». — Хинелин
Воспитание наблюдаемости: сделайте это легко
Важной ролью центральной команды наблюдаемости (или команды SRE, в зависимости от организационной структуры), является то, чтобы сделать наблюдаемость как можно более простым в принятии. Предоставление инструментов и включения для остальной части организации может помочь преодолеть сопротивление и блокировщики и способствовать культуре наблюдаемости.
Некоторые примеры вещей, которые могут сгладить путь к принятию и принятию по всей организации, могут включать:
- Стартовые наборы для базовых приборов OpenElemetry (OTEL) (например, обертка для разработчиков, чтобы вызовать разработчиков)
- Шаблоны для общих технологий, которые будут контролироваться (шаблонные панели панели для кафки и т. Д.)
- Руководство по наилучшей практике / Стандартизированный подход к инструментам с местом для расширяемости инженерами
- Общее управление наблюдением и процесс обратной связи и обновлений
Центральная команда наблюдения не должна быть владельцем работы, необходимой для эффективной реализации наблюдаемости, но они должны быть способными для этой работы, чтобы сделать жизнь лучше для других команд.
Как бы критично заставило разработчиков принять наблюдаемость, инструментаруя их приложения, также очень важно иметь спонсорство, которое поддерживает и громко выражает их поддержку. Наличие лидерства признает победы, которые стали возможными благодаря наблюдению, имеет большое значение для построения культуры наблюдаемости.
«Создание культуры наблюдаемости — это не только видение — это о мощности. Вы должны встретиться с командами, где они находятся, и сделать правильный путь легким путем. Если инструментария ощущается как дополнительный кредит, мы уже проиграли». — Хинелин
Принеси это полный круг
Содействие культуре наблюдаемости — это не только внедрение правильных инструментов, но и о выравнивании команд и заинтересованных сторон в отношении общего понимания ее ценности. Рассказывая о приоритете видимости, привлекая ключевых игроков и внедряя практики наблюдаемости в начале процесса разработки, организации могут обеспечить более плавные запуска продукта, более быстрое решение проблемы и лучшее общее здоровье системы. При правильном подходе наблюдаемость становится краеугольным камнем как оперативного превосходства, так и постоянного улучшения — и для Эшли меньше стресса.
Есть гораздо больше, чтобы обсудить, когда дело доходит до вашей стратегии наблюдения. В моей следующей статье я буду писать о том, как включить и стимулировать принятие наблюдения.
Хроносфера — это платформа наблюдения, созданная для контроля в современном, контейнерном мире. Признанная в качестве лидера крупными аналитическими фирмами, хроносфера дает клиентам сосредоточиться на данных и идеях, которые имеют значение для снижения сложности данных, оптимизировать затраты и быстрее решать проблемы. Узнайте больше новейших из хроносферных трендовых историй Youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Дэн Юенгст служит главным для маркетинга предприятий в Chronosphere. Дэн имеет более чем 20 -летний опыт работы в таких областях, как потоковые данные, наблюдение, аналитика данных, DevOps, облачные вычисления, вычисления сетки и высокопроизводительные вычисления. Дэн … Подробнее от Дэна Юэнгста