OpenAI запускает приложения SDK для CHATGPT: новая платформа приложений

По данным компании, на своем ежегодном мероприятии Devday Openai объявила о нескольких инициативах для разработчиков, которые сейчас насчитывают 4 миллиона. Наиболее интересно было новое приложение SDK, которое позволяет сторонним разработчикам создавать веб-приложения, которые работают в качестве интерактивных компонентов в разговорах CHATGPT. Openai говорит, что начнет принимать заявки приложения для рассмотрения и публикации »в конце этого года.

Да, это верно: это платформа приложений для Chatgpt. У этого есть эхо объявления о великолепных анонсах платформы смартфонов 2008 года — как iOS, так и Android. Возможно, учитывая огромную популярность OpenAI и парадигму пользователя Chatbot, это первая, это первая основная платформа приложений с подлинной вероятностью конкуренции с этими двумя магазинами приложений для смартфонов.

Интересно, что определяющая черта приложений SDK является его веб-моделью пользовательского интерфейса. На самом деле, это очень похоже на MCP-UI, который я посмотрел на глубину в этом году. Это делает его принципиально отличающимся как от платформ приложений iOS и Android, которые не являются веб-сайтами. Но даже несмотря на то, что приложение Openai SDK расположено на слое выше в стеке (сама CHATGPT имеет версии iOS, Android и браузер), он потенциально обладает огромной мощностью тяги в качестве платформы распределения приложений.

Давайте сначала убедимся, что мы понимаем гайки и болты, прежде чем мы слишком увлекаемся.

Приложения SDK: веб -компоненты в песочнице

По своей сути, компонент приложения CHATGPT — это веб -интерфейс, который запускается в песочнице Iframe в разговоре CHATGPT. Это та же самая основная парадигма, в которой работает MCP-UI, за исключением того, что MCP-UI был разработан для работы внутри любого агента, соответствующего MCP-это спецификация протокола, а не один продукт. Приложения SDK, напротив, тесно связаны с самим ЧАТГПТ.

Spotify в Chatgpt; через Devday.

CHATGPT выступает в качестве хоста приложения. Вы можете думать о стороннем приложении CHATGPT как о «мини-веб-приложении», встроенное непосредственно в интерфейс CHATGPT. Разработчик взаимодействует с мостом с компонентом Window.openai, который Openai вводит в iframe; Этот мост позволяет данным обмена приложениями с окружающим разговором и с его сервером MCP. Чтобы создать приложение с использованием приложений SDK, вы создаете обычный веб -код — HTML, CSS и JavaScript, которые могут быть связаны с современной структурой, такой как React или Vue — и Chatgpt производит его как интерактивную карту или панель в потоке чата.

Когда он анонсировал приложения SDK, Openai отметил, что система построена на протоколе контекста модели (MCP), но «расширяет MCP, чтобы разработчики могли разработать как логику, так и интерфейс своих приложений».

Как это расширяет MCP?

Под капотом Apps SDK использует ту же модель транспорта MCP и регистрации инструментов, которая теперь поддерживает внешние серверы инструментов и аспекты пользовательских GPT. MCP стал соединительной тканью между всеми новыми слоями расширяемости Openai, включая новые приложения SDK.

MCP-сервер разработчика разоблачает инструменты (для логики на стороне сервера) и ресурсы (для конечных точек данных или шаблонов пользовательского интерфейса). Каждый инструмент может ссылаться на выходной шаблон — как правило, URI, указывающий на объединенную HTML и JavaScript UI. Когда пользователь или модель запускают этот инструмент, CHATGPT увлажняет веб -компонент структурированным выходом инструмента и любыми прикрепленными метаданными.

Внутри iframe веб-приложение обращается к этим данным через представленное хост-интерфейсом. Openai. Это создает чистое разделение труда: модельные причины, выполняются сервер, и пользовательский интерфейс-чисто веб-основанный, обоснованный, основанный на событиях слой, который связывает весь опыт вместе.

Руководство по опыту пользователя

В ранней документации Openai подчеркивается, что встроенные компоненты должны выглядеть и вести себя так, как будто они родные для CHATGPT. Чтобы достичь этого, компания представила набор руководящих принципов UX и ограничений проектирования, охватывающих макет, цветные темы, типографику и доступность. Цель состоит в том, чтобы каждое стороннее приложение чувствовал себя сплоченным в среде чата, а не на иностранной веб-странице.

Разработчикам рекомендуется уважать границы макета Chatgpt, поскольку компоненты появляются в картах с последовательными краями, округленными углами и осознанием света или темной темы. Доступность также является основным требованием: приложения должны полагаться на семантические атрибуты HTML и ARIA, чтобы CHATGPT мог поддерживать навигацию по клавиатуре и совместимость с экраном.

Есть и другие ограничения, но ключ в том, что разработчики создают свои приложения из привычных веб -технологий. Идея состоит в том, чтобы поощрять экосистему небольших, визуально последовательных интерактивных карт — карт, календари, музыкальных плейлистов, зрителей документов и многого другого — которые чувствуют себя местными для Chatgpt. Пользователи могут вызвать их непосредственно по имени или встретить их в виде контекстных предложений, генерируемых моделью. В текущем предварительном просмотре ранние партнеры, такие как Spotify, Canva и Zillow, демонстрируют, как на практике выглядят эти встроенные веб -опыт.

Сравнение: приложения SDK против MCP-UI

Как отмечалось ранее, MCP-UI-это протокол, который позволяет разработчикам интегрировать представления веб-сайтов внутри нескольких платформ чата искусственного интеллекта, а не только CHATGPT. Теоретически, разработчик приложений может построить автономное приложение на основе браузера, а затем разоблачить его через MCP-UI, чтобы любой соответствующий агент, включая CHATGPT, мог взаимодействовать с ним.

Пример приложения Coursera внутри Chatgpt; через Devday.

Компромисс здесь знакомы всем, кто следовал дебатам на платформе конца 2000-х годов. MCP-UI стремится к портативности поперечного хоста, предоставляя отдельную спецификацию компонентов, которую любой агент может отображать, используя свой собственный рендеринг на стороне хоста. Приложения SDK, напротив, приоритет жесткой интеграции с продуктом CHATGPT. Разработчики, которые хотят один постоянный опыт в нескольких агентских оболочках, могут стремиться к MCP-UI, в то время как те, которые сосредоточены на обширной пользовательской базе CATGPT, и которые хотят, чтобы первые личные лаки, такие как импульсные карты, общие проекты или мгновенная проверка, вероятно, выберут приложения SDK в качестве самого короткого пути.

В некотором смысле, эта дискуссия напоминает одну из ранней эпохи смартфонов: зачем создавать приложение, которое нацелено только на платформу одной компании (скажем, iOS Apple), когда сама сеть должна быть универсальной платформой? Первоначально Facebook взял на себя сторону Интернета, создав веб -приложение HTML5, которое, как надеялось, примут и пользователи iPhone, и Android. Но, в конце концов, он капитулировал и разработал отдельные нативные приложения, потому что в то время нативный опыт был лучше.

Сегодня CHATGPT имеет гравитационную тягу, похожую на Apple и Google в 2008 году. Его огромная пользовательская база и растущее принятие интерфейсов на основе чата делают его убедительной платформой приложений. Тем не менее, в любопытной инверсии истории OpenAI перевернула парадигму: самая динамичная новая платформа приложений не является нативной мобильной ОС, а в хосте AI, рендеринг Mini-Apps, созданные с помощью веб-технологий.

Другими словами, если вы сторонний разработчик, создающий приложение ИИ, вам не обязательно беспокоиться о создании нативных платформ. Вместо этого вы можете просто создать веб -приложение, которое взаимодействует через MCP и работает внутри CHATGPT. Это, безусловно, то, что Openai хотела бы, чтобы вы сделали.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Ричард Макманус — старший редактор нового стека и пишет о тенденциях разработки веб -и приложений. Ранее он основал ReadWriteWeb в 2003 году и встроил его в один из самых влиятельных технологических новостей в мире. С самого раннего … Подробнее от Ричарда Макмануса

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *