Облачные операции сегодня, по большей части, являются зрелыми. Предприятия чувствуют себя комфортно с Cloud: у него есть определенная оперативная роль, и есть достаточно поддержки с помощью лучших архитектурных практик, сообщества, знаний, видимости и автоматизации для оптимального запуска большинства цифровых приложений и рабочих нагрузок в государственных, частных или гибридных облачных средах.
Более того, облачные технологии стали ключом к широко распространенному доступу к ИИ. В прошлые годы лишь немногие частные компании имели бы доступ к высокопроизводительной вычислительной емкости, необходимой для запуска рабочих нагрузок генеративных ИИ. Cloud оказывается большим выравнивателем, что делает этот уровень вычислительного вычисления — и услуги искусственного интеллекта, которые используют его доступные — для всех, кто хочет его использовать.
Но это идет по цене. Не обязательно финансовый, хотя это является фактором принятия решений. Более важная стоимость — подходы к облачной оптимизации. Проще говоря, широко распространенное и интенсивное внедрение ИИ начинает вытеснять организации за пределы их зон комфорта, когда дело доходит до облачных конфигураций. Целевое действие требуется, чтобы снова чувствовать себя комфортно с облаком.
Понимание характеристик ИИ
Чтобы понять, почему устоявшиеся нормы в облачных операциях протестируются, нужно сначала понять природу рабочих нагрузок ИИ, которые теперь просят водить облако.
Рабочие нагрузки ИИ являются мощными, как с точки зрения стоимости, которую они могут принести на предприятия, так и на вычислительные ресурсы, необходимые для их запуска в масштабе.
Это только увеличится, поскольку агент AI становится доминирующим типом ИИ, встречающегося в корпоративных средах. Агент AI означает более жесткую интеграцию технологии искусственного интеллекта в бизнес-процессы, когда автономные или полуавтономные программные агенты обрабатывают ключевые процессы или части этих процессов для достижения конкретных целей. Эти системы могут принимать быстрые решения, управлять сложными задачами и адаптироваться к изменяющимся условиям, предполагая, что основные системы работают, но мы доберемся до этого.
Что нужно знать предприятиям, так это то, что агент AI более интерактивен, чем другие формы искусственного интеллекта-постоянно «разговаривать» с исходными системами, хранилища данных, внешние инструменты, базы данных и API, что делает его более чувствительной к задержке эволюции технологии искусственного интеллекта. Разрушение или сбой облака или подключения могут привести к тому, что процесс, возглавляемый агентом, не удастся начать или достичь того, что он предполагал.
Главное, что нужно понять о рабочих нагрузках искусственного интеллекта, это то, что они имеют разные характеристики от тех, которые используются для определения облачных параметров сегодня. Это означает, что прошлые решения, чтобы сделать цифровое приложение или рабочую нагрузку оптимально в облаке, не всегда складываются в области ИИ. Сегодняшние облачные установки не предназначены для удовлетворения совершенно другого набора требований, и они не предназначены.
Для предприятий становится ясно, что те же усилия, которые пришли в оптимизацию облачных настройки для цифрового контекста, теперь должны быть повторены, чтобы оптимизировать облачные настройки для ИИ.
Органа на предприятиям, чтобы понять и захватить характеристики их различных рабочих нагрузок, так что поддержка облачной инфраструктуры может быть заряжена и настроена для удовлетворения растущих потребностей в производительности.
Как это будет выглядеть в облаке
Для большинства предприятий AI и исходных систем, которые он использует в нескольких облаках, центрах обработки данных, а также в сложной сети принадлежащих и неудобных связей подключения.
Не все услуги искусственного интеллекта будут доступны в местном регионе или зоне, что может быть первичным фактором в выборе модели ИИ предприятия.
С точки зрения эксплуатационного превосходства, предприятия должны определить, где инфраструктура, лежащая в основе услуги ИИ, и ее пользователи основаны на понимании того, может ли облачная среда поддерживать эти требования или необходимо внести изменения.
Это включает в себя понимание степени воздействия «общей» инфраструктуры «общей» инфраструктуры, такой как большое количество трафика, направляемого по одному связующему обращению или через одну точку агрегации, такую как точка присутствующего в центре обработки данных высокой плотности, которая имеет высокую концентрацию поставщиков услуг AI. Такой риск концентрации и отдельные точки отказа могут превышать внутренние допуски риска, учитывая все более важную роль ИИ.
Предприятия должны понимать, как работает каждый поставщик или часть своей цепочки предоставления услуг ИИ. Как поставщик приоритет трафику в определенных точках транзита или отключения? Они выполняют свою собственную балансировку нагрузки? Как это повлияет на предоставление услуг искусственного интеллекта? Ответы на эти вопросы могут дать предприятиям причина для повторного архитектора своих облачных настройки для диверсификации маршрутов трафика и улучшения вариантов избыточности.
Эти решения будут влиять на эффективность производительности. Время отклика в обратном пути в размере 50 мс может быть приемлемо для базового генеративного приложения ИИ, например, пользователь, задающий вопрос и ожидает контекстуального ответа. Но для оживленной агентной системы ИИ, если каждый ответ запроса занимает 50 мс, это быстро сложится. Пользователи могут испытывать чрезмерное время транзакции, тайм-ауты или другие проблемы, связанные с заторами и задержкой.
Предприятия могут повысить эффективность производительности за счет активного определения возможностей оптимизации для использования трафика и облачных ресурсов.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Майк Хикс работает в роли главных аналитиков решений в Cisco Тысячи. Он является признанным экспертом в области эффективности сети и приложений, с более чем 30 -летним опытом работы в отрасли поддерживает крупные, сложные сети и тесно сотрудничает с инфраструктурой … Подробнее от Mike Hicks