Microsoft запускает Magentic Marketplace для агентов ИИ

Microsoft Research только что запустила среду с открытым исходным кодом для изучения агентских рынков под названием Magentic Marketplace. Перед выпуском я поговорил с Эдже Камаром, управляющим директором лаборатории AI Frontiers в Microsoft Research.

Исследовательская группа Камара ранее разработала AutoGen, среду разработки агентов, которая стала популярной среди разработчиков Python, особенно для создания многоагентных систем искусственного интеллекта. Частично благодаря этому успеху разработка Magentic Marketplace была вдохновлена ​​AutoGen.

«AutoGen является частью Microsoft Agent Framework. [that] был выпущен месяц назад, — рассказал мне Камар. — Таким образом, мы смогли получить весь этот уровень программирования и включить его в продукт Microsoft. И теперь мы используем все знания AutoGen — что люди делают с AutoGen — чтобы подумать о том, какими агенты собираются стать».

Что такое Magentic Marketplace?

Идея Magentic Marketplace состоит в том, чтобы позволить исследователям смоделировать рынок для агентов ИИ, чтобы проверить, «как агенты договариваются, совершают транзакции и сотрудничают в условиях реальной рыночной динамики». Рынок также будет следить за безопасностью и справедливостью в этих системах.

Magentic Marketplace высокого уровня.

Хотя Magentic Marketplace является исследовательским проектом, позже он легко может стать коммерческим проектом — подобно тому, как AutoGen превратился в Microsoft Agent Framework (результат недавнего слияния AutoGen и Semantic Kernel, SDK, который я описал еще в апреле 2023 года).

«Мы ожидаем, что появятся публичные рынки», — сказал Камар. «Мы [Microsoft Research] вероятно, они не будут командой, которая их создаст, занимаясь исследованиями. Но […] Когда вы смотрите на некоторые из последних выпусков, поступающих в эту сферу, все это как бы направлено на начало тестирования этих торговых площадок».

«Лично я верю, что многие способы использования технологий будут переосмыслены и переработаны с учетом этих агентов», — добавила она. «И торговые площадки станут одной из областей, в которой, как я ожидаю, будет наблюдаться большая активность».

Протоколы в «обществе агентов»

Как и в любом хорошем исследовательском проекте, существует рабочая теория того, как должны работать агенты ИИ. Камар, чья докторская диссертация в Гарварде в 2000-х годах была посвящена самой теме агентов ИИ, использует фразу «общество агентов» для описания целей проекта.

«В этом понятии «общества агентов» речь на самом деле идет об агентах ИИ, которые собираются вместе, взаимодействуют, сотрудничают и ведут переговоры», — сказала она. «Кроме того, под наблюдением людей и реальным раскрытием того, как будет выглядеть мир, когда у нас будут эти агенты, как наличие этих агентов на нашей стороне сможет устранить некоторые недостатки, которые мы имеем в мире».

«В этом понятии «общества агентов» на самом деле речь идет об агентах ИИ, которые собираются вместе, взаимодействуют, сотрудничают и ведут переговоры».
– Эдже Камар, Microsoft Research

Ключевой частью исследования является тестирование протоколов связи, таких как Model Context Protocol (MCP) и Agent2Agent (A2A), а также новых платежных протоколов. Для агентской коммерции пока не существует протокола по умолчанию — хотя недавно OpenAI анонсировала протокол агентской коммерции (ACP), Google анонсировала протокол агентских платежей (AP2) в сентябре, а другие (например, Shopify) используют MCP-UI.

Камар также ожидает появления новых протоколов, которые помогут агентам сотрудничать, или расширения таких протоколов, как MCP и A2A, для сценариев использования на рынке. Например, как агентам правильно показывать информацию о транзакции?

Ключевые проблемы и предубеждения в моделировании агентов ИИ

Камар сказала, что они также осознают риски, связанные с агентами ИИ, такие как безопасность и предвзятость, и описала некоторые проблемы, с которыми они до сих пор сталкивались при моделировании рынка.

«Одна из вещей, которые мы наблюдаем, это то, что, опять же, хотя у нас есть эти протоколы связи [MCP, A2A, et al]модели, лежащие в основе этих агентов, иногда могут привести к некоторому парадоксу принятия решений. Если у них слишком много вариантов выбора, они, возможно, еще не настолько эффективны с точки зрения возможности сделать правильный выбор».

Magentic Marketplace в действии.

Группа также заметила «возникновение некоторых предубеждений».

«Например, одно из выявленных нами предубеждений называется «предвзятостью предложения». Модели сейчас предпочитают варианты, которые быстро появляются. Например, если вы быстрый агент, вам гораздо предпочтительнее, есть ли у вас лучшее предложение или нет».

Таким образом, хотя агенты смогли общаться друг с другом в моделировании рынка, предстоит проделать большую работу, чтобы сделать многоагентное сотрудничество реальностью. Чтобы достичь высочайшего уровня полезности этих рынков, отметил Камар, «нам нужно будет обучать этих агентов и создавать их по-разному».

Она упомянула пару технических проблем, с которыми они столкнулись при моделировании. Один из них — это то, что она назвала «вмешательством в пространство инструментов», что, по сути, означает, что агенты запутываются из-за распространения инструментов ИИ. «Сейчас у MCP очень много разных инструментов, — сказала она, — и иногда они называются одинаково, или даже соглашения об именах еще не существуют; и мы видим, что по мере того, как этот протокол развивается, с ним все еще возникают проблемы».

Magentic Marketplace уже продемонстрировал «ограничения существующих передовых моделей, когда дело доходит до сотрудничества и переговоров».
— Нравиться

Фактически, группа Камара сама создала инструмент MCP с открытым исходным кодом под названием MCP Interviewer. Она объяснила, что это «помогает разработчикам […] провести своего рода собеседование с этими инструментами, рассмотреть проблемы помех, чтобы они могли быть более информированы о том, какие инструменты использовать; и увидеть такие проблемы, как вмешательство инструментов, прежде чем это произойдет в их реальных системах».

Вторая проблема находится дальше по стопке — она отметила «ограничения существующих пограничных моделей, когда дело доходит до сотрудничества и переговоров». Они пытались заставить LLM сотрудничать друг с другом, чтобы помочь агентам выполнить задачу, и обнаружили, что производительность модели при таком сотрудничестве снижается.

«Итак, как команда, мы также изучаем, что необходимо изменить в способах обучения моделей, чтобы эти модели могли расширить возможности более сильных агентов с точки зрения их возможностей совместной работы», — сказал Камар.

Баланс между автономией агентов ИИ и контролем человека

Те из вас, кто достаточно взрослый, чтобы помнить эпоху доткомов в Интернете, помнят, что людям потребовалось несколько лет, чтобы чувствовать себя уверенно, вводя данные своей кредитной карты в веб-браузер для совершения онлайн-покупки. Так сколько же времени потребуется, чтобы чувствовать себя уверенно, передавая наши кредитные карты — или даже наши личные предпочтения — агенту ИИ?

«Я думаю, что для нас, для исследователей, очень важно, чтобы мы улучшали технологию и вносили ясность вокруг нее, насколько это возможно», — сказал Камар. «И когда приходит время, чтобы эти технологии оказались в руках людей, мы не даем им то, что мы создали, но на самом деле не понимаем; мы даем им то, что мы действительно понимаем и протестировали, мы поняли острые углы и работали над их улучшением».

Она добавила, что ее команда также учитывает, когда уместно человеческое наблюдение в этих агентных системах, которые в отрасли чаще называют «человек в цикле».

«Если мы собираемся создавать эти рынки и экосистемы, мы также можем потратить время на понимание и создание этих слоев, над которыми я, как пользователь, по-прежнему имею контроль…»
— Нравиться

«Поэтому я думаю, что также будет спектр, в котором мы не собираемся переходить к полной автономии агентов с первого дня», — сказала она. «Вы знаете, этого не должно быть. Если мы собираемся строить эти рынки и экосистемы, мы также можем потратить время на понимание и создание этих слоев, где я, как пользователь, все еще имею контроль — я все еще смотрю на все взаимодействия, я все еще рассматриваю варианты, я все еще могу задавать вопросы о том, что агент рекомендует мне».

Должен признаться, до этого интервью я не был уверен, почему Microsoft выпускает симулированную торговую площадку, а не реальную. Но Камар убедил меня, что не только разумно полностью протестировать взаимодействие агентов до запуска публичного рынка, но и на самом деле опасно не запускать сначала симуляции!

Кроме того, Magentic Marketplace должен помочь нам улучшить LLM, протоколы и инструменты искусственного интеллекта, которые понадобятся компаниям, чтобы сделать рынок публичных агентов жизнеспособным.

ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Ричард Макманус — старший редактор The New Stack и пишет о тенденциях в разработке веб-приложений и веб-приложений. Ранее в 2003 году он основал ReadWriteWeb и превратил его в один из самых влиятельных в мире новостных сайтов о технологиях. С самого начала… Подробнее от Ричарда Макмануса

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *