Сможет ли 50-летний актер-модель спасти агентский ИИ?

Автономия спонсировала этот пост.

2025 год обещает стать годом, когда агентный ИИ перейдет от исследований к производству. Gartner сообщает, что 34% предприятий сейчас используют агентов искусственного интеллекта, и к 2028 году до 15% ежедневных рабочих решений будут приниматься автономно, при этом ожидается, что треть корпоративных программных приложений будет включать в себя ту или иную форму агентных возможностей.

Однако до сих пор обещания, стоящие за агентным ИИ, не соответствуют реальности на местах.

«Большинство проектов агентного ИИ на данный момент представляют собой эксперименты на ранней стадии или проверку концепций, которые в основном вызваны шумихой», — сказала Анушри Верма, старший аналитик Gartner. «Это может заставить организации не заметить реальную стоимость и сложность масштабного развертывания агентов ИИ, что задержит запуск проектов в производство».

Проблема, как выясняется, может быть не в интеллекте моделей ИИ, находящихся в центре внимания, а, вероятно, в их облачной инфраструктуре.

Агентический ИИ представляет новый вид рабочей нагрузки: тысячи или даже миллионы полуавтономных процессов, которые воспринимают, рассуждают, действуют и сотрудничают во времени. Они хранят память, контекст и цели. Эти свойства нарушают большинство шаблонов облачной архитектуры, на совершенствование которых отрасль потратила два десятилетия.

Чтобы понять, почему так много агентных проектов останавливаются и что может их разблокировать, The New Stack поговорил с Мэтью Грегори, основателем и генеральным директором Autonomy, новой платформы как услуги (PaaS), полностью построенной на так называемой модели актера. Потратив годы на изучение того, что нужно для запуска автономных распределенных систем в промышленном масштабе, Грегори и его команда уверены, что именно так будет создаваться следующая волна продуктов искусственного интеллекта.

«Привычные шаблоны облачной архитектуры фактически стали барьерами», — сказал Грегори. «Продукты Agent действуют иначе, чем современные веб-приложения, и им нужны инструменты, разработанные с учетом этой разницы».

Как модель актера обеспечивает основу для агентов ИИ

Модель актера не нова. Впервые задуманная в 1973 году, она была вдохновлена ​​такими концепциями физики, как общая теория относительности и квантовая механика. С тех пор он стал элегантным шаблоном управления параллелизмом, который незаметно обеспечивает работу некоторых из самых требовательных современных систем, включая WhatsApp, Discord и Databricks.

В модели актора базовой единицей вычислений является не контейнер или функция, а актор — легкая, независимая сущность, которая «владеет» своим собственным состоянием, обрабатывает сообщения асинхронно и взаимодействует с другими акторами посредством передачи сообщений. Сотни тысяч участников могут работать параллельно внутри одного процесса: запускаться за миллисекунды, дешево простаивать и продолжать работать столько, сколько необходимо.

«Если вы поместите агент в контейнер, он будет простаивать, пока вы платите за емкость. В масштабе это кошмар DevOps«.
— Мэтью Грегори, основатель и генеральный директор Autonomy

Для агентов ИИ моделирование каждого из них как отдельного субъекта подходит почти идеально. Действующими лицами (агентами) являются:

  • С состоянием: Каждый актер помнит свою личность, воспоминания, контекст и цели.
  • Долговечный: Актеры могут оставаться бездействующими в течение длительного времени, не тратя ресурсы зря.
  • Асинхронный: Они изящно завершают работу, ожидая завершения модели большого языка (LLM) или ответов инструмента.
  • Массивная параллель: Миллионы людей могут координировать свои действия и сотрудничать для поддержки агентных шаблонов, таких как субагенты и организованные рабочие процессы.
  • Встроенные сообщения: Почтовые ящики и очереди делают безопасное общение естественным.

«Актер занимает небольшую площадь и прекрасно справляется с параллелизмом и обменом сообщениями», — объяснил Грегори. «Это правильная атомная единица для агентных систем».

Почему контейнеры и бессерверные системы терпят неудачу

Проще говоря, традиционные облачные примитивы не были предназначены для агентных рабочих нагрузок. Хотя бессерверные функции идеально подходят для коротких периодов работы без сохранения состояния, измеряемых миллисекундами, они гораздо менее подходят для агента, который должен хранить память и контекст для долго выполняющихся задач. Реконструкция состояния агента при каждом вызове увеличивает задержку и затраты, а также нарушает непрерывность.

Контейнеры, с другой стороны, сохраняют состояние, но имеют вес. Поддержание тысяч (не говоря уже о миллионах) в основном простаивающих контейнеров в сети является операционно болезненным и финансово неустойчивым.

«Если вы поместите агент в контейнер, он будет простаивать, пока вы платите за емкость. В масштабе это кошмар DevOps«, — сказал Грегори. «Отключитесь от сервера, и агент забудет, кем он был, каждый раз, когда просыпается. Актеры обеспечивают постоянное состояние и исключительную экономическую эффективность».

Другими словами, актеры позволяют разработчикам мыслить с точки зрения отношений и сотрудничества без операционных накладных расходов или растраты ресурсов, которые приводят к сбою большинства прототипов агентов.

Решение проблем доверия и безопасности данных для автономных агентов

Даже если проблемы параллелизма и масштаба будут решены, быстро всплывет еще одна проблема: доверие. Агенты не просто выполняют вычисления; они также должны взаимодействовать — часто через облака, службы и организации. Каждое взаимодействие должно быть аутентифицировано, зашифровано и проверяемо.

Autonomy решает эту проблему с помощью Private Links, уровня безопасного обмена сообщениями, созданного на основе набора инструментов Ockam с открытым исходным кодом, который команда Грегори запустила несколько лет назад. Каждый агент на платформе создает уникальную криптографическую нечеловеческую личность (NHI), а затем устанавливает взаимно аутентифицированные каналы со сквозным шифрованием со своими коллегами. Это устраняет необходимость в VPN, общедоступных конечных точках и общих секретах в криптографическом смысле.

«Движение данных — одна из самых сложных проблем для разработчиков агентов», — сказал Грегори. «Частные ссылки решают эту проблему с помощью продуманной криптографии и протоколов, встроенных с первого дня. Еще лучше, агент, работающий на автономном компьютере, может создать безопасное соединение с любым другим агентом, смоделировать сервер контекстного протокола, инструмент, приложение или хранилище данных в любом другом облаке или сети».

Это наследие имеет значение. Ockam — библиотека идентификации, обмена сообщениями и контроля доступа с активным сообществом с открытым исходным кодом — прошла испытания на безопасность связи между распределенными системами. Автономия распространяет те же самые примитивы доверия на мир агентов ИИ.

«В некотором смысле, у нас есть пятилетняя фора в решении проблем, которые необходимо решить для поставки агентской продукции», — отметил Грегори. «Автономия строится непосредственно на этом фундаменте».

От деталей к платформе

Даже при правильной архитектуре и модели безопасности многие команды все еще утопают в работе по интеграции. Типичный агентный стек сегодня включает в себя дюжину фреймворков — LangChain для инструментов LLM, CrewAI для мультиагентной координации, а также векторные базы данных, планировщики, уровни наблюдаемости, идентификацию, возможно, даже немного Kafka и кучу специального клея. Каждый решает одну часть; ни один из них не образует единого целого.

«Инфраструктуру сложно масштабировать и легко ошибиться», — сказал Грегори. «Как продуктовая компания, вы в конечном итоге тратите все свое время на сантехнику, а не на продукцию».

Платформа Autonomy как услуга призвана устранить этот разрыв. Он объединяет среду выполнения актера, уровень доверия и инструменты наблюдения в единую среду. Разработчики создают локально с помощью Python SDK, а затем развертывают его в глобально распределенной среде выполнения, не затрагивая контейнеры, Kubernetes или бессерверную оркестровку. Масштабирование, маршрутизация и безопасный обмен сообщениями уже встроены.

На первый взгляд автономия может выглядеть как еще одна агентная структура, но есть важное различие. Фреймворки помогают вам строить; платформы помогут вам осуществить доставку. Грегори хорошо иллюстрирует это такой аналогией: «Это похоже на отношения между Next.js и Vercel или между Rails и Heroku. Фреймворки помогают вам писать код, платформы — к клиентам».

«Простое указание людям «использовать актеров» не устраняет все проблемы распределенных систем — это просто ставит перед ними новый набор сложных инженерных задач».
— Мэтью Грегори

Актерам тоже нужна хорошая архитектура

Хотя модель актора предлагает правильную основу для агентных систем, сама по себе она не является панацеей. Инженеры, которые ранее создавали структуры на основе актеров, хорошо знают компромиссы: отслеживание одного запроса среди тысяч асинхронных актеров может быть чрезвычайно трудным; неограниченный параллелизм может привести к шторму сообщений; и восстановление состояния в случае сбоя или перезапуска актера требует тщательной оркестровки. Модель актера отлично подходит для агентов, но ей также необходимы некоторые ограничения.

«Это все реальные проблемы», — признал Грегори. «Простое указание людям «использовать актеров» не устраняет всех проблем распределенных систем — оно просто ставит перед ними новый набор сложных инженерных задач. Создание среды выполнения, которая правильно обрабатывает идентификацию агентов, отслеживание, планирование, восстановление после сбоев и безопасность, является серьезной частью инфраструктурной работы. Это именно то бремя, которое мы хотели, чтобы Autonomy сняла с себя разработчика».

Осознав давно известные проблемы, связанные со средой выполнения на основе актеров, и разработав свою платформу для их решения, Autonomy превращает некогда эзотерическую архитектуру в нечто, что бережливые команды могут использовать для создания надежных агентных систем промышленного уровня.

Опыт разработчиков: маленькие команды, большие амбиции

В настоящее время первоначальная аудитория Autonomy — это небольшие, быстро развивающиеся команды — стартапы и группы «стартап-режима» внутри более крупных предприятий, которым необходимо быстро выпускать продукцию, но которые скованы ограниченной численностью персонала. Эти команды не могут себе позволить создавать индивидуальную инфраструктуру, настроенную на масштабирование, прежде чем отправить их в производство.

«Мы очень, очень одержимы опытом разработчиков», — сказал Грегори. «Командам, ограниченным людьми, временем или ресурсами, понадобится что-то, что просто работает, что-то автоматическое, в полном масштабе».

Платформа уже включает в себя инструменты корпоративного уровня, такие как журналы, метрики, оценки и безопасные конечные точки для наблюдения и операций. Но, что примечательно, самым большим преимуществом Autonomy, по-видимому, является ее простота. Разработчики могут сосредоточиться на том, на что способны их агентные продукты, а не на том, как заставить их работать.

Почему этот архитектурный сдвиг имеет значение сейчас

Если последнее десятилетие облачных вычислений было посвящено эластичным вычислениям, то следующее десятилетие будет посвящено эластичной автономии — использованию не только большего количества серверов, но и большего количества решений. Архитектурная единица этого будущего — это не контейнер или функция, а актер.

Модель актора обеспечивает основу для систем, которые могут мыслить, запоминать и координировать действия в масштабе. Эта идея существует уже полвека, но недавнее появление агентного ИИ наконец-то придает ей новое значение.

Ставка Autonomy заключается в том, что PaaS, построенная вокруг действующих лиц, с вплетенными в нее доверием и безопасностью, станет основой по умолчанию для этих систем. Команды, использующие эту модель, не просто создадут более умных агентов; они быстрее отправят готовую к производству продукцию.

«Мы не столько изобретаем новую идею, сколько объединяем тысячу архитектурных решений в единую платформу и предлагаем ее как простой продукт», — сказал Грегори. «Актеры всегда решали эту проблему. Теперь платформа Autonomy позволяет каждому разработчику легко поставлять масштабируемый, подключенный агентский продукт».

Autonomy обеспечивает единую основу для создания систем на базе искусственного интеллекта. Замените десятки разрозненных точечных решений единой платформой с первого дня. Создавайте, развертывайте, подключайте, масштабируйте и выполняйте итерации своих автономных продуктов — ясно и уверенно. Узнайте больше ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Кимберли Мок — репортер в области технологий и дизайна, освещающая статьи об искусственном интеллекте, робототехнике, квантовых вычислениях, технической культуре и науке для The New Stack. По образованию архитектор, она также является иллюстратором и многопрофильным дизайнером, страстно увлеченным… Читать далее от Кимберли Мок

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *