Kubecon: платформа K8s от VCluster для управления графическими процессорами как услугой

АТЛАНТА — VCluster Labs (ранее Loft Labs) выпустила расширенную версию одноименного дистрибутива Kubernetes, адаптированную для работы с графическими процессорами NVIDIA — предпочтительной платформой для выполнения больших, ресурсоемких рабочих нагрузок искусственного интеллекта.

Компания будет демонстрировать свое программное обеспечение на выставке KubeCon+CloudNativeCon North America 2025, которая пройдет на этой неделе в Атланте, на стенде № 421.

Платформа официально называется Платформой аренды инфраструктуры для искусственного интеллекта для максимизации эффективности графических процессоров в средах NVIDIA Kubernetes. Он сочетает в себе расширенную изоляцию, динамическое масштабирование и гибридную сеть, предоставляя организациям платформу для запуска служб графических процессоров в облачной форме для своих внутренних пользователей.

Гибкая аренда графических процессоров

«Наша история — о гибкой аренде», — объяснил генеральный директор vCluster Лукас Джентеле в интервью TNS. «Иногда вам нужны отдельные кластеры для отдельных арендаторов. Арендатором может быть один из ваших клиентов или одна из ваших команд разработчиков. Это может быть отдельный разработчик или приложение».

По словам Джентеле, две группы пользователей сочтут эту технологию потенциально ценной. Одним из них могут быть крупные организации, в которых много потенциальных пользователей борются за ограниченный набор графических процессоров. Другой вариант — для публичного облачного сервиса, который захочет предлагать услуги на базе графических процессоров для своей собственной клиентуры.

По словам Джентеле, гибкость чрезвычайно важна в обоих случаях, учитывая динамичный характер работы ИИ. Возможность их быстрого динамического выделения и освобождения была бы дополнительной функцией для такой среды.

По словам компании, используя способность vCluster выделять несколько индивидуально защищенных «виртуальных кластеров» из одного большого кластера, компании могут быстрее предоставлять кластеры, использовать больше своих графических процессоров и более эффективно управлять операциями второго дня.

Платформа Tenancy обеспечивает «динамическую многоарендную оркестровку графических процессоров с той же гибкостью и контролем, которые предприятия ожидают от общедоступного облака», но для частных систем искусственного интеллекта на базе NVIDIA», — далее пояснил Пол Нашавати, руководитель практики и главный аналитик theCUBE Research, в своем заявлении. Он отметил, что исследование CUBE Research обнаружило, что 71% организаций сообщили о неэффективности использования графических процессоров как о серьезной проблеме.

VCluster также опубликовал эталонную архитектуру для запуска платформы аренды инфраструктуры на линейке готовых графических серверов NVIDIA DGX.

Платформа аренды инфраструктуры

Дистрибутив построен на ряде технологий Kubernetes, некоторые из которых недавно были представлены vCluster, в том числе:

  • KubeVirt для создания виртуальных машин, в том числе для графических процессоров.
  • Частные узлы VCluster и автоматические узлы vCluster на базе Karpenter, позволяющие виртуальным кластерам динамически автоматически масштабировать мощность графического процессора и процессора в облаках, центрах обработки данных и физических средах.
  • VCluster VPN — оверлейная виртуальная частная сеть на основе Tailscale.
  • Контроллер сетевой изоляции Netris для сетевой изоляции, предоставляющий каждому арендатору собственный выделенный сетевой путь.
  • VNode Runtime для предоставления изолированной программной среды контейнера, которая помогает предотвратить сбои в работе контейнеров.

Он напрямую интегрирован с программным обеспечением для управления кластером NVIDIA Base Command Manager (BCM). Это программное обеспечение, которое NVIDIA предоставляет для запуска серверов с графическим процессором без операционной системы и подключения их к сети.

По словам Джентеле, VCluster предоставляет все вспомогательное программное обеспечение и простоту использования. Виртуальные графические процессоры можно предоставить через Kubernetes Cluster API или с помощью Terraform, Helmcharts или kubectl.

Новая эталонная архитектура vCluster для систем NVIDIA DGX предоставляет набор лучших практик по развертыванию виртуальных кластеров в системах, ориентированных на графические процессоры, что позволяет предприятиям самостоятельно реализовывать облачную среду Kubernetes.

ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Джоаб Джексон — старший редактор The New Stack, специализирующийся на облачных вычислениях и системных операциях. Он освещал вопросы ИТ-инфраструктуры и ее развития более 30 лет, в том числе работал в IDG и Government Computer News. До этого он… Подробнее от Джоава Джексона

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *