Cdavid Aronchick осмотрел историческую комнату в 116 Pall Mall в центре Лондона на конференцию Cloud Rejekts Conference-обязательна, если вы посетите конференцию в Кубеконе. Какое пространство, кстати.
Aronchick является генеральным директором Expanso, стартапа, который предоставляет распределенные вычисления для рабочих нагрузок. Вместо того, чтобы перемещать данные, вычислитель переходит к самим данным — все более актуально, поскольку корпоративные клиенты смотрят за пределы облака для своих вычислительных потребностей.
Он указал, что у всех устройств в комнате когда -нибудь появятся богатую компьютерную архитектуру. Признание рассвета, что графические процессоры придут на эти устройства. Они, конечно, не будут водяными, погружающимися в массивные графические процессоры. Эти крошечные графические процессоры могут стоить 500, 100 долларов или даже намного меньше.
Рабочие нагрузки с распределенной трудом появляются реальным образом. Как мы знаем, графические процессоры могут обрабатывать наборы данных наиболее сложного порядка, используемые в средах ИИ и машинного обучения.
Алиса в Даталанде
Вы начинаете изучать последствия этих новых точек данных, и это становится триппи. Британский автор Льюис Кэрролл познакомил нас с метафорой взгляда на кроличье дыру. Там в стране распределенных вычислений находится неизвестный мир, который может быть больше похож на страну чудес Алисы, чем мы захотим понять.
Но это природа вычислений повсюду: это как страна чудес. Что будет с триллионами устройств, что будет с рабочими нагрузками? Как этот Trippy World получит свой вычислитель?
Аронхик работал в Google, где он стал соучредителем проекта Kubeflow, который «был разработан, чтобы помочь упростить развертывание систем с открытым исходным кодом для [machine learning] Приложения на платформах Kubernetes в масштабе », согласно сообщению New Stack 2018 года в проекте.
Для Aronchick речь идет о том, как мы думаем о различных средах Edge Edge, чтобы разработчики могли разрабатывать, развернуть и управлять архитектурами приложений, будь то стандартные программные модели или модели искусственного интеллекта.
Он и его команда разработали архитектуру с открытым исходным кодом, которую они называют Бакалхау. Это распределенная модель вычислительных данных, которая дополняет Kubernetes, Docker и Webassembly (WASM). Это позволяет пользователям запускать вычислительные задания, где данные генерируются и хранятся.
Аронхик сказал, что возможность сетевой сети станет немного рискованной при работе с более чем одной зоной в облачной сети с кластерами Kubernetes. Крестовые материалы, региональное движение данных и работа в облаках-архитектуры Kubernetes нуждаются в лучшем способе.
Вы можете увидеть его с помощью вариантов использования, которые предлагает Аронхик. Журналы, например, могут быть обработаны на краю. Вывод машинного обучения (ML) может произойти в источнике данных. С планировщиком данные работают на локальных узлах без централизованных озер данных.
Речь идет об использовании удаленного сервера или устройства Интернета вещей (IoT), каким бы он ни был, для обработки данных у источника до его отправки в центральное место. Данные могут перейти к некоторому выводу на источнике. Он мог использовать WASM для изоляции и обработки данных в источнике.
Принести вычисление
Среда развития облаков — это правило, а не исключение. Но с Kubernetes, Docker и Wasm, способностью использовать сервер, скажем, в ресторане становится гораздо более выполнимым.
Это все же, однако, оставляет проблему вычисления данных. Согласно своей документации, Bacalhau использует локальное хранилище, ведро S3 или других поставщиков хранения — уменьшая ненужное движение данных. Клиент использует то, что Bacalahau вызывает рабочих мест и казни. Работы определяют рабочий процесс, а казни запускают задание параллельно по узлам. Больше здесь.
По оценкам Gartner, около 10% данных, генерируемых предприятием и обрабатываются за пределами традиционного централизованного центра обработки данных или облака. К 2025 году Гартнер прогнозирует, что этот показатель достигнет 75%.
Аронхик думает об этом таким образом: «Я предприятие с 100 узлами, распространенными по всему миру. Я уже владею ими, и они уже могут быть в облаке, но они не под одним контроллером, таким как Databricks, Snowflake, Kubernetes и т. Д. Вы хотите получить работу, работающую им работу, новая модель ML, новая конфигурация, что угодно — и не можете реверно, потому что это не так, потому что это не так, потому что это не так, потому что это не так.
Этот контроллер? Вот где Expanso может войти в сцену. Клиент может поместить один из агентов Expanso на один из этих узлов, чтобы дать ему ощущение единой плоскости управления.
«Мы можем бежать по телефону, конечно!» Ароншик сказал. «Но есть 100 миллионов серверов по всему миру, и каждый раз, когда бизнесу нужен один, или виртуальная машина, которая не в их центральном центре обработки данных, они собираются добавлять к вызову».
Для контекста, это 49 миллисекундное время пинга между Лос-Анджелесом и Нью-Йорком. Скорость света никогда не станет быстрее. Мы ничего не можем с этим поделать.
Сети доставки контента получают это очень хорошо. Акамай теперь использует технологию Fermyon WASM для изоляции потоков данных. Тем не менее, есть необходимость переместить вычислитель.
Но вычисление данных — это огромная стоимость, написал Богдан Курнасов, ныне старший инженерный менеджер на Bunny.net, в новом стеке в 2024 году.
«Маршрутизация трафика в центров обработки данных — это время и деньги, — написал он. «В сочетании с растущим спросом на все более персонализированное веб -опыт, нам нужно было изучить новый подход к облачным вычислениям. К счастью, мы уже создали сеть краевых узлов с нашей сетью доставки контента (CDN). Добавление возможностей вычислений в наши узлы CDN было следующим логическим шагом».
Данные неизбежно пойдут на град, и это сдвиг от модели Super Data Center. Вычислитель также должен будет идти на край.
Затем вопрос сводится к тому, почему такая компания, как Expanso, имеет шанс в этом новом мире. С одной стороны, Bacalhau — это проект с открытым исходным кодом. Он может пройти на NVIDIA, Intel или AMD. Это аппаратное агностик. Технология расширения может использовать вычислительные возможности распределенных графических процессоров.
Мне ясно, почему предложения с открытым исходным кодом, такие как то, что предоставляет Expanso, имеет четкий путь в качестве основного сервиса, поскольку мы ускоряемся в направлении сети триллионов устройств.
Вот и ты, мой взгляд из облачных нативных режиштов. Увидимся в Атланте.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Алекс Уильямс является основателем и издателем нового стека. Он давний технологический журналист, который занимался TechCrunch, Siliconangle и тем, что сейчас известно как ReadWrite. Алекс был журналистом с конца 1980 -х годов, начиная с … Подробнее от Алекса Уильямса