На этой неделе OpenAI проводит ежегодную конференцию разработчиков в Сан -Франциско. После ряда потребительских и финансовых объявлений в последние дни и недели, в том числе запуск приложения для создания видео Sora, сегодняшние новости прямо сосредоточены на строительстве на платформе Openai.
Два основных момента-бета-версия AgentKit, openai’s Agent Builder и приложения в CHATGPT, что позволит разработчикам принести больше опыта, подобных приложениям, в интерфейс CHATGPT.
Agent Builder
«ИИ переехал за последние пару лет из систем, в которых вы можете попросить что угодно, в системы, которые вы можете попросить сделать что угодно, и мы начинаем видеть это через агентов, программное обеспечение, которое может выполнять задачи с контекстными инструментами и доверием»,-сказал соучредитель и генеральный директор Openai Сэм Альтман. «Но несмотря на все волнения вокруг агентов и всего потенциала, очень немногие на самом деле вступают в производство. Трудно понять, с чего начать, какие рамки использовать, и есть много работы. Есть оценщики оркестровки, подключение инструментов, создание хорошего пользовательского интерфейса, и каждый из этих слоев добавляет много сложности, прежде чем вы узнаете, что на самом деле собирается работать».
AgentKit, по сути, является строителем агента без кодов на платформе Openai, которая предназначена для того, чтобы позволить разработчикам и предприятиям создавать агентов-и многоагентные системы-и вставить их в производство всего за несколько кликов.
Изображение предоставлено: openai.
По большей части, это не так отличается от других строителей агента без кодов/низкокодов. Но в то время как OpenAI позиционирует это как инструмент для предприятия-с возможностью предоставить данные из внешних сервисов, таких как Dropbox, Google Drive, SharePoint и Microsoft Teams, а также серверы сторонних модельных протоколов контекста (MCP) (с реестрами для этих разъемов)-полностью готовая к предприятию (что более подходящие к вспомогательному или управляющему, чтобы включить в Depthose.
Agent Builder позволяет разработчикам устанавливать Guardrails для пользовательского опыта, в том числе, например, обнаружение джейлбрейков и обеспечение того, чтобы в чате не было лично идентифицируемой информации. Он также интегрируется с Evals, инструментом Openai для тестирования подсказок и измерения поведения модели.
Кредит изображения: новый стек/Фредерик Лардиноис.
Чтобы поместить эти агенты в производство, OpenAI сегодня также запустил Chatkit, инструментарий для внедрения этих агентских опытов в приложения. Это делает еще один шаг из процесса привлечения этих агентов в производство. Некоторые из клиентов Openai, таких как Hubspot и другие, уже взяли эту услугу для власти внутренних и внешних вариантов использования, таких как агент поддержки клиентов.
Изображение предоставлено: openai.
Приложения в Chatgpt
Другим крупным объявлением дня был запуск приложений в CHATGPT (для всех пользователей за пределами Европейского союза). Идея здесь состоит в том, чтобы вызовать сторонние приложения в интерфейсе CHATGPT-и для разработчиков создают их, используя приложения SDK, что само по себе основывается на MCP Антрии. Действительно, приложения SDK, который является открытым исходным кодом, по сути является расширением MCP, чтобы позволить разработчикам создавать как логику, так и интерфейс своих приложений.
На практике это будет выглядеть примерно так. Скажем, пользователь хочет просматривать дома на Zillow. Это может вызвать приложения Zillow прямо из Chatgpt («Zillow Show Me Homes в Портленде или менее 500 000 долларов»). Затем Zillow появится карту и интерактивный пользовательский интерфейс, чтобы увидеть эти дома, причем пользователь сможет уточнить этот поиск или задать больше вопросов о доме в панели чата.
Кредит изображения: новый стек/Фредерик Лардиноис.
SDK включает в себя возможности, чтобы пользователи регистрировались в приложениях, что, в свою очередь, позволяет разработчикам предлагать персонализацию и доступ к премиальным функциям.
«Магия этого нового поколения приложений в CHATGPT — это то, как они сочетают знакомые интерактивные элементы — такие как карты, плейлисты и презентации — с новыми способами взаимодействия с помощью разговора», — объясняет компания в сегодняшнем объявлении.
Изображение предоставлено: openai.
Первые доступные приложения из Booking.com, Canva, Coursera, Expedia, Figma, Spotify и Zillow. Вскоре OpenAI планирует запустить каталог приложений, которые соответствуют его руководящим принципам и открыть его разработчикам.
На данный момент некоторые части SDK все еще находятся в движении. OpenAI специально вызывает, что вскоре он предложит больше гранулированных элементов управления для того, как данные передаются разработчикам.
Один вопрос, который всегда остается с этими рынками, — это открытие. В самые ранние дни голосовых помощников, таких как Google Home и Amazon Alexa, эти компании уделяют большое внимание созданию платформы разработчиков, но пользователи никогда не материализовались, потому что никто не знал, какие голосовые команды действительно были доступны. Сегодняшние системы ИИ, очевидно, умнее, и у ряда известных услуг, несомненно, не будет проблем с использованием на массовой платформе, такой как CHATGPT. Но для новых разработчиков Discovery, вероятно, останется проблемой, и если OpenAI начнет активно предлагать услуги, что, по словам компании, это будет, все еще есть вопросы о том, как он будет обрабатывать инструменты, которые конкурируют друг с другом.
Разработчики также могут быть немного нерешительными, чтобы поддержать эту новую возможность, учитывая, что GPTS, предыдущая попытка Openai внедрить приложения в CHATGPT, в основном задержался в безвестности с момента его запуска.
Codex GA и другие
В дополнение к двум заголовочным объявлениям, Openai также сегодня запустил Codex, его агента по кодирующему искусству, в общую доступность, и добавил слабую интеграцию и SDK, который позволяет разработчикам встраивать инструменты, которые включают агент CLI CODEX в свои трубопроводы CI/CD и свои собственные инструменты.
Этот SDK теперь доступен для TypeScript, и скоро появится больше языков.
Openai также сегодня запустила новую модель голоса в реальном времени-GPT-Realtime-Mini, которая, по его мнению, на 70% дешевле, чем его более крупные кузены, не теряя большого качества. Существует также новая небольшая модель изображения-GPT-Image-1-Mini-которая обещает быть на 80% дешевле в использовании, чем более крупные модели изображений OpenAI.
Для разработчиков, которые хотят использовать самые модели Openai в своих собственных приложениях, GPT-5 Pro теперь доступен в API.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Прежде чем присоединиться к новому стеку в качестве старшего редактора для ИИ, Фредерик был редактором предприятия в TechCrunch, где он освещал все, от роста облака и самых ранних дней Kubernetes до появления квантовых вычислений …. Подробнее от Frederic Lardinois