Конг спонсировал этот пост.
В современных распределенных системах ландшафт традиционных подходов мониторинга терпит неудачу. В то время как мониторные панели и предупреждения говорят нам, что что -то не так, они часто оставляют нас слепыми, почему это происходит и как это исправить. Следующая эволюция в операциях API — это не только наблюдение, а также о отказе, и этот сдвиг принципиально изменяет способ, которым платформные команды подходят к надежности системы.
Парадокс наблюдения
Современные организации вложили значительные средства в платформы наблюдения, собирая огромное количество метрик, журналов и трассов. Тем не менее, когда возникают критические проблемы, команды по -прежнему играют детектива, коррелируя разрозненные источники данных и делая образованные предположения о коренных причинах. Этот парадокс наблюдаемости — с большим количеством данных, но меньшей ясностью — подчеркивает фундаментальный пробел в том, как мы подходим к пониманию системы.
Проблема не количество данных; Это неспособность динамически сосредоточиться на нашей наблюдательной линзе, когда и где это важнее всего. Непрерывный мониторинг с высокой точностью по всем компонентам системы часто нецелесообразно из-за накладных расходов и ограничений затрат. Что нужно организациям, так это способность переходить от пассивного наблюдения к активному исследованию.
Необходимый императив
Обучение представляет собой переход парадигмы от реактивного мониторинга к упреждающим возможностям расследования. В то время как наблюдаемость раскрывает то, что пошло не так, отказа от того, почему это произошло и как это исправить. Это различие имеет решающее значение для современных команд платформы, которым необходимо минимизировать среднее время для разрешения (MTTR) при сохранении производительности системы.
Эффективная отзыва требует трех основных возможностей:
- По запросу глубокого осмотра: Способность динамически увеличивать наблюдательную точность для конкретных компонентов, запросов или поездок пользователей, не причиняя вреда общей производительности системы. Этот целевой подход позволяет командам собирать подробную информацию, необходимую для анализа основной причины, без накладных расходов непрерывного мониторинга высокого разрешения.
- Контекстуальная корреляция: Когда возникают проблемы, команды нуждаются в немедленном доступе к коррелированным данным по нескольким измерениям наблюдения, включая следы, журналы, метрики и бизнес -контекст. Власть заключается не в том, чтобы иметь эти данные отдельно, а в том, что они разумно подключены и представлены в контексте исследования.
- Интеллектуальная выборка и фильтрация: Современные системы генерируют огромные объемы телеметрии данных. Платформы отзывов должны предоставлять сложные механизмы отбора проб, которые позволяют командам сосредоточиться на конкретных условиях, сегментах пользователей или состояниях системы при фильтрации шума.
Шлюз API в качестве контрольной точки наблюдения
API Gateways занимают уникальную позицию в современных архитектурах, служащих централизованными контрольными точками, через которые протекает все движения API. Это позиционирование делает их идеальными платформами для внедрения расширенных возможностей отладки, поскольку они могут обеспечить полную видимость в потоках запроса/ответа, взаимодействиях с сервисом и моделями поведения системы.
Когда отладки встроены в слой шлюза, команды платформы получают несколько преимуществ:
- Комплексный запрос жизненного цикла видимости: Каждый запрос API проходит через шлюз, обеспечивая полную видимость во всем жизненном цикле запроса/ответа, включая аутентификацию, ограничение скорости, преобразования и решения маршрутизации.
- Инструментация с нулевым ударом: В отличие от наблюдения на уровне приложений, которая требует изменения кода или дополнительного инструментария, отладка на основе шлюза фиксирует подробную информацию без изменения услуг или приложений вверх по течению.
- Централизованное политическое обеспечение: Политики отладки могут последовательно применяться во всех услугах и маршрутах, обеспечивая комплексное покрытие, не требуя координации в нескольких группах разработчиков.
Экономика целевой наблюдения
Традиционные подходы наблюдения часто заставляют организации выбирать между комплексным охватом и контролем затрат. Мониторинг высокой точки зрения во всех компонентах системы может быстро стать чрезмерно дорогим, как с точки зрения затрат на инфраструктуру, так и влияния на производительность.
Целевая отказа решает эту экономическую проблему, позволяя организациям поддерживать базовую наблюдаемость, в то же время динамически увеличивая наблюдательную точность, когда это необходимо. Этот подход может снизить затраты на наблюдение на 60-80%, фактически повышая эффективность отладки посредством целенаправленного, высококачественного сбора данных.
Практическая реализация: от теории к практике
Ведущие организации уже внедряют платформы расширенного отказа, которые демонстрируют эти принципы в действии. Эти системы обычно предоставляют:
- Выборка на основе выражения: Способность определять сложные критерии выборки с использованием простых выражений (таких как «http.method == ‘post’ и response.status> = 400»), чтобы сосредоточиться на конкретных условиях или сегментах пользователей.
- Многомерная корреляция: Автоматическая корреляция между трассами/пролетами, подробными журналами и системными метриками в пределах одного интерфейса исследования, что устраняет необходимость прыгать между несколькими инструментами.
- Управление временным сеансом: Захваченные по времени сеансы отладки, которые автоматически истекают, гарантируя, что мониторинг высокой точки непреднамеренно не станет постоянным бременем производительности.
- Совместимость Opentelemetry: Приверженность открытию стандартов гарантирует, что данные отладки могут быть экспортированы и проанализированы с использованием существующих наборов инструментов наблюдения, когда это необходимо.
Путь вперед
Эволюция от мониторинга до наблюдения была только началом. Следующая волна инноваций в надежности системы будет поступать из платформ, которые обеспечивают истинную отзыва — способность быстро понимать, диагностировать и решать проблемы с помощью целенаправленного, интеллектуального наблюдения.
Организации, которые охватывают этот сдвиг, окажутся с более быстрым временем разрешения, снижением операционных накладных расходов и более уверенными командами платформы. Поскольку системы продолжают расти в сложности, способность эффективно отлаживать станет такой же важной, как способность эффективно масштабироваться.
Будущее принадлежит платформам, которые могут ответить не только на «что случилось», но и «почему это произошло» и «как это исправить», и они будут делать это, не жертвуя производительностью или нарушая банк. В этой новой парадигме отзывность не просто функция; Это конкурентное преимущество.
Современные платформы управления API, такие как Kong Konnect, уже реализуют эти расширенные возможности отладки, объединяя трассировку по требованию с комплексным регистрацией в объединенных интерфейсах отладки. Недавно Конг объявил об общей доступности отладчика Konnect в Kong Konnect, единой платформе API. Если вы являетесь клиентом Kong Konnect, отладчик теперь доступен для вашей организации. Войдите в Konnect, перейдите к менеджеру Gateway, выберите плоскость управления и начните отладку ваших API как с помощью трассий, так и журналов. Если вы новичок в Kong, вы можете начать с подписки на Kong Konnect бесплатно!
Kong Inc. является ведущим разработчиком Cloud API Technologies и выполняет миссию, позволяющая компаниям по всему миру стать «Pi-Pirst». Конг помогает организациям во всем мире — от стартапов до предприятий из списка Fortune 500 — выпустить производительность разработчиков, надежно строить и ускорить время на рынке. Узнайте больше новейших из Cong Trending Stories youtube.com/thenewstack Tech Moving быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Veena Rajarathna является менеджером по продуктам персонала в Kong со страстью к безопасности, которая так же жестока, как аппетит гориллы. Ее профессиональное путешествие было отмечено захватывающими вехами, включая участие в лесном пожаре, революционном решении в Пало -Альто … Подробнее от Veena Rajarathna