Strobelight: Meta’s Ebpf Profiler Framework для массивного инфра

Представьте, что если хотите, вы отвечаете за мониторинг всей массовой инфраструктуры Meta. Это страшная мысль, не так ли? Теперь, в революционном разработке, инженерная команда Meta успешно использовала технологию EBPF для улучшения своего профилирутеля, StrobeLight, StrobeLight,

Когда я говорю «улучшить», я не имею в виду какое -то минутное улучшение, которое мог бы полюбить только специализированный инженер. Нет, я имею в виду «сокращение циклов процессора на 20%, что приравнивает к сокращению на 10-20% числа необходимых серверов для лучших услуг Meta». Это серьезная сбережения в вычислении, которая равна серьезной экономии денег.

StrobeLight, Meta’s Fletive Profiler Framework, предназначена для обеспечения комплексных возможностей профилирования в крупномасштабной инфраструктуре компании. Он состоит из нескольких подпрофили, которые собирают различные типы данных о производительности, включая ЦП, графический процессор и профили памяти. Работа номер один в рамках — определить узкие места производительности и оптимизировать использование ресурсов на флоте машин Meta.

Ключ к недавнему успеху Стробезайта заключается в интеграции EBPF. Это обеспечивает эффективный, низкополостный мониторинг и отслеживание событий системы непосредственно в ядре Linux. Используя EBPF, SrobeLight теперь может собирать данные о производительности с минимальным влиянием на системные ресурсы.

Точнее, согласно Фонду EBPF, EBPG позволяет Meta отслеживать время процессора, проведенное на функциональные вызовы и пути выполнения; Звоните в стеки для местных и некоренных языков (например, Python, Java и Erlang); Анализ задержки задержки в Off-CPU и запроса на обслуживание; и профилирование AI/GPU и отслеживание памяти.

EBPF для сбережений

Кроме того, сэкономив на расчете время и денежные средства, использование EBPF в StrobeLight привело к тому, что Foundation EBPF претендует на годовую экономию мощности в 15 000 серверов от одного изменения кода с одним символом. Раскрасьте меня впечатлен. Это также позволяет быстрее отладки и анализ производительности. Это позволяет инженерам предотвратить регрессии, прежде чем они достигнут производства.

С помощью EBPF SrobeLight теперь может отслеживать распределения памяти GPU и более эффективно обнаруживать утечки памяти. По словам Рихама Селима, инженера по программному обеспечению Meta, EBPG позволяет в любой момент распределения памяти для каждого графического процессора,

Имейте в виду, EBPF не идеален. Селим отметил. Ему не хватает видимости в внутренних графических процессорах; Огромный объем данных может быть ошеломляющим; И ему не хватает применения понимания. Так, например, вам нужно добавить код наблюдения в программу Pytorch, а не полагаться только на EBPF.

Таким образом, важно понимать, что StrobeLight — это гораздо больше, чем просто EBPF. Согласно Meta, «StrobeLight-это не один профилировщик, а оркестратор многих различных профилировщиков (даже специальных), который работает на всех производственных хостах на Meta, собирая подробную информацию об использовании процессора, распределении памяти и других показателях производительности из работающих процессов».

Действительно, все вместе Strobe Light имеют 42 различных профилирующих. Большинство, но не все из них, основаны на EBPF.

Безопасная инъекция пользовательского кода

Так что это, EBPF жизненно важно для SrobeLight. Мета -инженеры отмечают: «EBPF обеспечивает безопасную впрыск пользовательского кода в ядро, что обеспечивает очень низкий накладной сбор различных типов данных и разблокирует так много возможностей в пространстве наблюдения, что трудно представить, как строб будет работать без него».

Не спрашивайте меня, как вы могли бы это сделать. Я знаю кое -что о наблюдении и без EBPF. Я бы даже не узнал, с чего начать. К счастью, так как у нас есть EBPF, нам не нужно беспокоиться об этом.

Хотите попробовать это для себя? Ты можешь. Большая часть Srobelight была недавно открыта по лицензии Apache 2. Тем не менее, Meta еще не с открытым исходным кодом профилировщиков и библиотек Strobelight. Компания обещает, что это сделает это с тех пор, как они откроют их, они станут «более надежными и полезными». Как бы то ни было, здесь уже достаточно открыто, чтобы сделать Strobelight достойным изучения для тех, кто хочет следить за массивными инфраструктурными системами.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Стивен Дж. Воган-Николс, известный как SJVN, пишет о технологиях и технологии, так как CP/M-80 был передовой операционной системой ПК, 300BPS был быстрым подключением к Интернету, WordStar был современным текстовым процессором, и нам понравилось. Подробнее от Стивена Дж. Вогана-Николса

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *