Как искусственный интеллект расширяет возможности хранилища Kubernetes

Nutanix спонсировал этот пост.

Поскольку предприятия спешат развертывать приложения искусственного интеллекта и обработки данных в средах Kubernetes, стандартных интерфейсов хранения контейнеров (CSI) недостаточно для удовлетворения бизнес-требований в новой операционной модели.

Десять лет назад, когда Kubernetes впервые появился на сцене, большинство контейнерных рабочих нагрузок не имели состояния и не сохраняли контекст между различными сеансами. Типичное приложение Node.js или NGINX будет повторно создано на основе доступных метаданных, но оно не будет читать и записывать данные в постоянное хранилище или из него.

Рост приложений с сохранением состояния в Kubernetes

Эти шаблоны относительно легко применить к веб-приложениям без сохранения состояния, а разработка микросервисов с максимально возможным сохранением состояния позволяет получить высоконадежные и управляемые системы.

Однако, как писали Брендан Бернс, Джо Беда, Келси Хайтауэр и Лаклан Эвенсон в книге «Kubernetes: Up and Running», «почти каждая система, имеющая хоть какую-то сложность, имеет состояние где-то в системе, от записей в базе данных до фрагментов индекса, которые предоставляют результаты для поисковой системы в Интернете. В какой-то момент вам нужно где-то хранить данные».

Интеграция этих данных с контейнерами и решениями для оркестровки контейнеров часто является самым сложным аспектом построения распределенной системы. Авторы книги «Kubernetes: Up and Running» предполагают, что эта сложность связана с тем фактом, что «переход к контейнерным архитектурам — это также движение к несвязанной, неизменяемой и декларативной разработке приложений».

Около пяти лет назад в Nutanix мы начали наблюдать рост числа приложений с отслеживанием состояния, использующих контейнерные базы данных, такие как Cassandra, Redis, PostgreSQL, MySQL и Kafka. Поскольку этот сдвиг уже начался, недавнее быстрое внедрение ИИ на предприятиях значительно ускорило этот процесс.

Ускорение неудивительно. Как отметил в статье «Обучение с подкреплением» Фил Уиндер, генеральный директор и основатель Winder.AI, ИИ — это «дитя науки о данных, которая представляет собой всеобъемлющую научную область, изучающую данные, генерируемые явлениями».

Другими словами, данные вашей организации имеют основополагающее значение для успеха любой инициативы, которую вы можете реализовать с использованием ИИ.

Хотя данные важны благодаря ИИ, они также лежат в основе почти каждого приложения для таких вещей, как персонализированные рекомендации для улучшения пользовательского опыта, аналитика поведения пользователей, безопасность, наблюдаемость (например, журналы и метрики), Интернет вещей (IoT) и периферия.

Вывод приводит аналитик Gartner Джулия Палмер, которая прогнозирует, что «к 2027 году 80% развертываний Kubernetes потребуют расширенных функций для постоянного хранения контейнеров по сравнению с 30% в начале 2023 года».

Понимание CSI, основы хранилища Kubernetes

Kubernetes CSI — это стандартный механизм работы с персистентностью в Kubernetes. Этот уровень состоит из набора API-интерфейсов, которые приложения могут использовать для чтения и записи в базовую систему хранения.

Поскольку CSI является стандартом, каждый поставщик систем хранения данных имеет свою собственную реализацию — Nutanix CSI, Dell CSI, Red Hat OpenShift CSI, Portworx CSI и т. д. — и каждый драйвер CSI имеет атрибуты, специфичные для поставщика, предлагаемые через встроенный механизм расширения CSI.

Nutanix CSI предоставляет Nutanix Unified Storage (NUS) для контейнерных приложений с отслеживанием состояния. NUS — это программно-определяемая платформа служб данных, которая объединяет файловое, объектное и блочное хранилище в единую, высокопроизводительную, плотную и экономичную платформу, упакованную в соответствии с потребностями клиента:

Nutanix CSI для приложений с отслеживанием состояния, использующих Nutanix Unified Storage. (Источник: Nutanix)

Ограничения CSI для корпоративных рабочих нагрузок

CSI подходит для предоставления постоянного хранилища одному кластеру, но помимо этого у него есть некоторые ограничения. Главным образом, он не обеспечивает механизм защиты данных или обеспечения непрерывности бизнеса и аварийного восстановления (BCDR). Это особенно важно в жестко регулируемых отраслях, таких как финансовые услуги и здравоохранение. Потребность в BCDR в регулируемых отраслях не нова, но она становится все более актуальной вместе с ростом числа приложений, работающих в кластерах Kubernetes.

Правила также определяют, где должны находиться данные. В таких регионах, как EMEA, политики могут требовать, чтобы все копии данных оставались в пределах национальных границ, добавляя уровень соответствия географическим особенностям к и без того сложной технической задаче.

Для любого приложения постоянные данные должны располагаться как можно ближе к тому месту, где оно работает, что требует репликации данных для BCDR и связанных с этим вариантов использования, таких как перебалансировка рабочей нагрузки и высокая доступность. Это особенно важно в гетерогенных моделях развертывания, например при переносе облака из локального облака в общедоступное для обработки временных всплесков спроса, таких как Черная пятница, сроки поступления в университеты, онлайн-продажи билетов или всплески потоковой передачи мультимедиа. Разрыв облака требует быстрой и последовательной репликации среды приложений и связанных с ней данных в облако и из него.

Синхронная и асинхронная репликация данных

Репликация данных может быть синхронной или асинхронной, в зависимости от того, как управляются операции записи:

  • Синхронная репликация данных означает, что данные постоянно копируются с главного сервера и на все серверы-реплики одновременно.
  • Асинхронная репликация данных означает, что данные сначала копируются на главный сервер, а затем копируются на серверы-реплики в соответствии с предварительно настроенной политикой защиты, определяющей частоту репликации данных и продолжительность хранения данных.

Хотя синхронная репликация гарантирует отсутствие потери данных, асинхронная репликация требует существенно меньшей пропускной способности и обходится дешевле.

Заполнение пробелов

Nutanix Data Services for Kubernetes (NDK) может заполнить пробелы, оставленные CSI, позволяя вам управлять, контролировать и эксплуатировать разрозненные миры виртуальных машин (ВМ) и контейнерных приложений как единое целое на одной унифицированной платформе.

NDK использует знакомые механизмы Kubernetes, чтобы сократить время обучения. Он поставляется в виде диаграммы Helm, и пользователи взаимодействуют с ним из командной строки, используя kubectl. Службы данных не зависят от распределения Kubernetes. Хотя мы бы предпочли, чтобы клиенты использовали наш дистрибутив Kubernetes, службы данных будут работать с альтернативами, такими как Red Hat OpenShift или Amazon EKS Anywhere. NDK поддерживает как синхронную, так и асинхронную репликацию данных.

В NDK асинхронная репликация может выполняться с максимальной частотой один раз в час. Политика задается на уровне приложения, а не на уровне кластера, поэтому разные приложения в одном кластере могут использовать разные стратегии репликации данных.

В BCDR используется асинхронная репликация. В типичном примере у вас может быть два центра обработки данных в разных странах — скажем, основной в Испании и резервный в Германии — чтобы вы могли переключаться с одного на другой в случае крупной катастрофы.

Помимо BCDR, Nutanix также поддерживает высокую доступность с помощью синхронной репликации.

Высокая доступность с использованием синхронной репликации. (Источник: Nutanix)

Синхронная репликация гарантирует нулевую потерю данных в случае сбоя, но требует, чтобы оба центра обработки данных располагались в непосредственной физической близости. Это означает, что он непригоден для защиты от стихийных бедствий, таких как землетрясения или ураганы, но в зависимости от вашего бизнеса это может быть ценным подходом.

Например, один из наших клиентов управляет круизными лайнерами и имеет две отдельные комнаты данных. Они находятся в разных местах, но физически близко друг к другу и соединены через высокоскоростную сеть с задержкой менее 10 мс. Преимущество состоит в том, что если одна комната данных выходит из строя, например, из-за отключения электроэнергии или затопления, корабль может переключиться на другую и продолжить работу.

За пределами CSI: почему ИИ требует большего от хранилища Kubernetes

Конвергенция виртуальных машин и контейнеров в единую платформу является практической необходимостью для предприятий, сталкивающихся со сложными распределенными приложениями с интенсивным использованием данных. Поскольку приложения с отслеживанием состояния продолжают распространяться в средах Kubernetes (эта тенденция ускоряется благодаря внедрению искусственного интеллекта), потребность в сервисах передачи данных корпоративного уровня становится критической.

Хотя CSI обеспечивает основу для постоянного хранилища, такие решения, как NDK, необходимы для организаций, которым требуется защита данных, соответствие требованиям и эксплуатационная гибкость, необходимые для корпоративных контейнерных рабочих нагрузок. NDK предлагается как часть решения Nutanix Kubernetes Platform (NKP), полноценной полнофункциональной платформы, которая сочетает в себе инфраструктуру, оркестрацию Kubernetes, хранилище, службы обработки данных и управление жизненным циклом приложений на одной платформе.

Являясь мировым лидером в области облачного программного обеспечения, Nutanix меняет способы ведения бизнеса организаций. Мы предлагаем единую платформу для запуска всех ваших приложений и данных в локальных, публичных облаках, гибридных средах и на периферии, упрощая при этом операции и снижая сложность. Узнайте больше Последние новости Nutanix ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Рамья Прабхакар — руководитель отдела управления продуктами в Nutanix, возглавляющий команду по созданию основных служб данных и хранения для ИИ и облачных приложений. Она специализируется на предоставлении современной инфраструктуры и услуг для приложений, ориентированных на данные, в Kubernetes со всеми… Читать далее от Рамья Прабхакар Аарти руководит маркетингом продуктов и решений в Nutanix, специализируясь на платформе Nutanix Kubernetes (NKP) и ее полнофункциональном облачном решении. Имея опыт работы в области компьютерных наук и обеспечения успеха клиентов, она обладает глубокими знаниями в области корпоративных технологий и Kubernetes… Подробнее от Аарти Махеша

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *