В течение последних 30 лет индустрия наблюдений привлекла миллиарды инвестиций и добилась заметных достижений в сборе и анализе метрик. Но фундаментальный подход к наблюдению остался неизменным.
Лучшие практики постоянно проповедуют: отправьте как можно больше телеметрии — вы никогда не знаете, что вам нужно.
Но на самом деле больше данных не всегда лучше. Во -первых, хотя телеметрия действительно имеет решающее значение для отладки и решения проблем, она буквально поставляется по высокой цене. Помимо платы за хранение и поставщиков, организации также теряют деньги на пропускную способность сети, электроэнергию и инженерные накладные расходы.
Возможно, более тревожным является то, как большинство методов наблюдения и инструментов полностью упускают из виду мобильные. Несмотря на то, что миллионы долларов вливают в отрасль, почти все эти средства направлены на наблюдение на стороне сервера.
Почему наблюдение упускает из виду мобильные
Я сел с Питером Морелли, соучредителем и генеральным директором, а также с Мэттом Кляйном, соучредителем и техническим директором, от BitDrift до обсуждения событий в наблюдении и почему отрасль исторически упустила из виду мобильные устройства. Они нашли все иронично:
«Мир перешел в систему на основе приложений. Большинство людей взаимодействуют с услугами, разработанными через приложение. Но как отрасль, мы недостаточно инвестировали в понимание-и помогали исправить-опыт пользователя, где это действительно имеет значение: на мобильных устройствах»,-говорит Кляйн.
Как насчет уровня успеха 99,99%, часто рекламируемой поставщиками услуг в качестве доказательства надежности? Кляйн говорит, что эта цифра не обязательно отражает реальность: «Вероятно, в моей карьере было сто раз, когда сервер имеет успех 100%, но просьбы всех клиентов рухнут. Это делает эффективную скорость успеха нулевым».
При наставлении объяснить, почему мобильная наблюдаемость продолжает отставать от остальной части отрасли, несмотря на ее очевидную важность, и Морелли, и Кляйн рассказывают об этом в списке технических проблем прачечной.
С одной стороны, масштаб мобильных устройств представляет собой проблему. По сравнению с сотнями тысяч серверов, команды сталкиваются с десятками миллионов мобильных устройств, в том числе IOS и орду Android различных моделей. Сложные структуры разрешений пользователя добавляют еще один уровень сложности, как и стабильность сети.
«По большей части, серверные приложения имеют постоянную сеть, которая не работает. Конечно, есть неудачи, но в целом это очень гетерогенная, ручная среда», — сказал Кляйн. «Мобильные сети, с другой стороны, пятнистые».
В целом, эти проблемы делают мобильный домен сложным, сложным и дорогим комбинацией, которая составляет длительные циклы устранения неполадок.
Например, на сервере вы можете продвигать потенциально 20 развертываний за день, в зависимости от проблемы. Однако для установленных приложений общее время переключения в лучшем случае больше похоже на две недели, требуя одной недели для утверждения App Store и еще одну неделю для пользователей для установки обновлений. Помимо соображений затрат, этот цикл является интенсивным временем и трудоемкой, но Морелли и Кляйн говорят, что он не должен оставаться таким.
Для наблюдения, Битдрифт говорит, что меньше на самом деле больше
«Мы хотели использовать другой подход к наблюдению, который позволяет инженерам получать данные, когда они действительно нуждаются в этом — и не тогда, когда им это не нужно», — говорит Кляйн. Это то, что они многообещают с BitDrift, стартапом, который вышел из Lyft в 2023 году. В то время как имя BitDrift относительно новое на сцене, сама команда тряслась наблюдением за кулисами в течение многих лет.
Морелли и Кляйн встретились, работая над глобальными результатами в Twitter, прежде чем связаться с третьим соучредителем Битдрифта Мартином Конте Мак Донелл, когда они переехали в Лифт в 2015 году. Там трио возглавил решение для службы езды, которое, как они описывают, «Flip[s] многолетняя парадигма мобильной наблюдаемости на голове, [enabling engineers to] Зарегистрируйте все, разумно выбирайте, что хранить, и мгновенно разверните изменения во всем свой флот ».
Вместо того, чтобы отправлять и хранить всю телеметрию по умолчанию, решение регистрирует все локально, используя круглый буфер для хранения. Благодаря плоскости управления в реальном времени инженеры могут включать, извлекать или регулировать телеметрию по требованию без необходимости развертывания обновлений приложений. Таким образом, они могут мгновенно устранение устранения и быстро решить проблемы без необходимости употребления, индекса или хранить ненужные данные — все это за более низкие затраты.
«Перенесемся на шесть лет,-говорит Морелли, и« мы поняли, что еще не кто-то еще не делает то, что делает наше решение ». Именно тогда они решили принять свое решение независимым. После поддержки более 50 миллионов устройств для Lyft (и, по сообщениям, сэкономив компании десятки миллионов долларов в год), небольшая команда из девяти из девяти запустила ранее внутреннее решение в качестве BitDrift в 2023 году, а Lyft стала своим первым клиентом и крупнейшим инвестором.
Разрыв старой формы наблюдения
Подход Битдрифта — это полное 180 из традиционных практик наблюдения — и они признают, что это было немного шоком для инженерных групп. «В наших головах пробурили, что больше данных лучше — но это не совсем так», — говорит Кляйн.
Стоимость является очевидным недостатком этого более срочного подхода. Основная причина, по которой наблюдаемость настолько дорого, заключается в том, что ценообразование большинства решений основана на цифрах и сеансах, где чем больше вы регистрируетесь, тем больше вы платите. Внутренне эта модель часто вызывает напряженность между финансами и инженерными группами; Финансовые команды лоббируют, чтобы отправить меньше данных для сокращения расходов, в то время как инженерные команды лоббируют, чтобы отправить больше данных для поддержки устранения неполадок.
Финансы не единственная стоимость наблюдения, хотя; Большинство решений также истощает труд, время и ресурсы. В конце концов, чем больше данных вы генерируете, тем больше времени и усилий требуется, чтобы разобраться во всем этом, определить коренные причины и решать проблемы.
«Поставщики всегда побуждают вас регистрировать больше информации, но вы не обязательно получаете ценность из всей этой информации», — отмечает Морелли. «[But] Если у вас есть сила, чтобы быть более намеренной в сборе данных только тогда, когда они вам нужны, и выключение их, когда вам больше не нужно, то гораздо проще обернуть голову вокруг того, на что вы смотрите », — добавляет Кляйн.
Это то, что обещает решение BitDrift-но людям может быть трудно привлечься к подходу бренда, по крайней мере, по крайней мере, по крайней мере.
Морелли и Кляйн признают, что им нередко сталкивается с сопротивлением при введении Битдрифта. Они говорят, что это потому, что они пытаются принципиально изменить отрасль и делать вещи иначе, чем у всех других поставщиков наблюдения.
«У нас есть много вопросов, например,« что, если мне нужны эти данные через два года? », — делится Кляйн. Но он также говорит, что клиентам не займет много времени, чтобы начать петь другую мелодию: «Как только они поймут, что могут получить огромное количество данных, когда они нуждаются в этом, чтобы немедленно решить их проблемы-откровенно откровенно».
Ввод в новую эру наблюдения
Почему никто еще не взял трещину при изменении вековой парадигмы наблюдения?
Первый ответ Морелли и Кляйна состоит в том, что технология просто очень сложная-но, похоже, это больше, чем это. «Другие поставщики наблюдаемости просто не стимулируются, чтобы изменить модель затрат», — говорит Кляйн. «Для большинства поставщиков, чем больше данных они отправляют, тем больше они могут заряжать». Это также вопрос инерции. Поскольку индустрия сосредоточена на более много лет, в течение многих лет не естественно подвергать сомнению традиции и искать альтернативы.
Но, возможно, Битдрифт подталкивает отрасль к поворотному моменту.
Морелли и Кляйн говорят, что они уже получают запросы от клиентов о других случаях использования, отмечая, что проблемы, которые их решение решается, выходят за рамки мобильных до разнообразных отраслей. В частности, они видят множество возможностей для промышленного использования, где контроль в режиме реального времени может быть очень выгодным, таким как нефть и газ, морская, космос и промышленная техника.
На данный момент фокус Битдрифта является чисто мобильным, но их подход может вдохновить совершенно новую эру наблюдения.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом.