Управление графическим процессором Kubernetes только что получило серьезное обновление

AWS спонсировала этот пост.

«Как системный инженер низкого уровня, если вы выполняете свою работу правильно, никто не узнает о вашем существовании, но в ту минуту, когда вы выполняете свою работу неправильно, все узнают, что вы существуете».

Это наблюдение выдающегося инженера Nvidia Кевина Клюса подчеркивает, почему сообщество открытого исходного кода Kubernetes спокойно создает фундаментальные функции и абстракции, которые будут определять, как организации будут управлять рабочими нагрузками ИИ в течение следующего десятилетия.

На выставке KubeCon + CloudNativeCon North America 2025 в Атланте основатель и издатель New Stack Алекс Уильямс провел групповую дискуссию с Клюсом и Джесси Батлером, главным менеджером по продуктам Amazon Web Services, о двух разработках, которые заслуживают большего внимания: динамическое распределение ресурсов (DRA) и предстоящая абстракция рабочей нагрузки, которая может преобразовать многоузловые развертывания ИИ.

DRA: графические процессоры, которые работают как хранилище

Динамическое распределение ресурсов (DRA), которое стало общедоступным в Kubernetes 1.34, решает давнюю проблему, связанную с запросом ресурсов графического процессора в Kubernetes.

«Единственной кнопкой, которая была у вас в старом способе запроса доступа к ресурсам, был простой подсчет», — сказал Клюс. «Вы могли бы сказать: «Мне нужны два графических процессора», но вы не могли бы сказать, какой тип графического процессора. Вы не могли бы сказать, как вы хотите, чтобы этот графический процессор был настроен после того, как он вам будет предоставлен».

DRA, который Батлер назвал «одной из самых элегантных вещей, которые я когда-либо видел», заимствует свою концептуальную модель у постоянных томов и постоянных томов — знакомых абстракций, которые группы хранения данных используют уже много лет. Разница в том, что DRA работает с любым специализированным оборудованием, а не только с хранилищем, а это означает, что сторонние поставщики теперь могут предлагать свои собственные драйверы устройств и делать оборудование доступным для пользователей Kubernetes стандартизированными способами.

Новая абстракция рабочей нагрузки для интеллектуального планирования

Но одного только DRA недостаточно для сложных развертываний ИИ. Иногда вам нужно несколько подов на нескольких узлах, чтобы все они одновременно подключались к сети или, наоборот, не подключались вообще. Именно эту проблему призвана решить новая абстракция Kubernetes (называемая просто «абстракцией рабочей нагрузки»).

«Вы хотите иметь возможность выражать такие вещи, как «Я могу создать некоторое подмножество этих модулей, но если я не смогу получить их все, я не хочу, чтобы какой-либо из них появлялся», — сказал Клюс. «И, по крайней мере, сегодня вы не можете выразить это в мире Kubernetes».

Базовая реализация запланирована на выпуск Kubernetes 1.35 17 декабря, хотя Клюс подчеркнул, что впереди еще предстоит значительная работа. Эта абстракция позволит пользователям определять группы модулей с ограничениями планирования и требованиями топологии, что-то вроде селекторов узлов на стероидах.

«Это будет определять будущее того, как все это будет работать в течение следующих 10 лет Kubernetes», — сказал Клюс, подчеркнув, что Рабочая группа по управлению устройствами, в которой эти функции обретают форму, настоятельно приглашает сообщество к участию.

Полный разговор, в том числе обсуждение агентных архитектур искусственного интеллекта, малых языковых моделей и того, почему философия Unix по-прежнему важна в эпоху больших языковых моделей, читайте в полной версии интервью.

С момента своего создания Amazon Web Services (AWS) была для клиентов лучшим местом для создания и запуска программного обеспечения с открытым исходным кодом в облаке. AWS гордится тем, что поддерживает проекты с открытым исходным кодом, фонды и партнеров. Узнайте больше Последние новости AWS TRENDING STORIES YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одного эпизода. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Мишель Гиноу — бывшая журналистка, ставшая разработчиком программного обеспечения. Она использует обе профессии, чтобы писать на глубокие технические темы, от K8 до Kotlin. Мишель является соавтором книги «Облачная трансформация: практические модели инноваций» от O’Reilly Media и… Читать далее от Мишель Гиноу

Разработка сайтов в Гомеле

Добавить комментарий Отменить ответ

Похожие записи

Стратегии слияния, чтобы сохранить строительство в больших монорепо.

Edge Wars нагревается, поскольку ARM стремится обойти Intel, Qualcomm

Только 27% организаций обладают наблюдаемой наблюдаемостью, говорится в отчете

Руководство архитектора по айсбергу Apache

OutsyStems запускает низковеренный Workbench для строительства агентов AI Enterprise

Как найти и исправить то, что разрушает производительность вашего приложения

Исследователи находят уязвимость промежуточного программного обеспечения Next.js

Внутренние проекты: Работа внутри паноптикона

AWS и Google создают мультиоблачный мост

Что такое наблюдаемость LLM и мониторинг?

Кубрикс думает, что вы скоро сожалеете, что построите свой собственный IDP

Go Experts: «Я не хочу поддерживать сгенерированный AI код»

Вам тоже может быть интересно:

Смелый рецепт высшего образования

Комментарий: Университетам нужно больше искусственного интеллекта, а не меньше

UREP Spotlights Инновационные исследования студентов

Преподавания преподавателей, рекламные акции на 2025–2026 гг.

Успешно переход от идеи к прототипу

Биотехнологическая конференция исследует новые границы AI в здравоохранении

Использование ИИ для обнаружения аномалий ЭКГ

Intern Insight: Tiffany Joy Amoncio

Понимание стажера: Мадалина Купса

Идеальное совпадение (скорость)

Что нужно знать о гриппе этого года

Найдите свое место: успешное начало жизни в колледже