OpenAI запускает новые инструменты, чтобы помочь предприятиям построить агенты искусственного интеллекта

Во вторник Openai выпустил новые инструменты, предназначенные для того, чтобы помочь разработчикам и предприятиям построить агенты ИИ — автоматизированные системы, которые могут самостоятельно выполнять задачи — используя собственные модели и структуры ИИ компании.

Инструменты являются частью нового API API Openai, который позволяет предприятиям разрабатывать пользовательские агенты искусственного интеллекта, которые могут выполнять веб -поиск, сканировать файлы компании и ориентироваться в веб -сайтах, так же, как продукт Openai оператора. Ответы API эффективно заменяют API API Assistaints OpenAI, который компания планирует закат в первой половине 2026 года.

Шумиха вокруг агентов ИИ резко выросла в последние годы, несмотря на то, что технологическая индустрия изо всех сил пыталась показать людям или даже определить, что на самом деле такое «агенты искусственного интеллекта». В последнем примере ажиотажа агента, опередив утилиты, эффект китайского стартапа -бабочка в начале этой недели стал вирусным для новой платформы агента искусственного интеллекта под названием Manus, которую пользователи быстро обнаружили, не выявил многие обещания компании.

Другими словами, ставки высоки для Openai, чтобы принести правильные агенты.

«Довольно легко продемонстрировать ваш агент», — сказал TechCrunch, — сказал Olivier Godemont, глава продукта API Openai, в интервью TechCrunch. «Масштабировать агента довольно сложно, и заставить людей использовать его часто очень сложно».

Ранее в этом году Openai представила двух агентов ИИ в CHATGPT: оператор, который ориентируется на веб -сайты от вашего имени, и Deep Research, которые составляют исследовательские отчеты для вас. Оба инструмента дали представление о том, чего может достичь агентская технология, но осталось очень желаемое в отделе «автономии».

Теперь с ответами API, OpenAI хочет продать доступ к компонентам, которые питают агенты ИИ, позволяя разработчикам создавать свои собственные агентские приложения в стиле исследования. OpenAI надеется, что разработчики смогут создать некоторые приложения с помощью своих агентских технологий, которые чувствуют себя более автономными, чем то, что доступно сегодня.

Используя API ответов, разработчики могут нажать те же модели искусственного интеллекта (в предварительном просмотре) под капотом инструмента поиска по поиску CHATGPT OpenAI: поиск GPT-4O и Mini GPT-4O. Модели могут просматривать Интернет, чтобы получить ответы на вопросы, ссылаясь на источники, поскольку они генерируют ответы.

Openai утверждает, что поиск GPT-4O и Mini GPT-4O очень точно. На эталоне компании Simpleqa, который измеряет способность моделей отвечать на короткие вопросы по поиску фактов, поиск GPT-4O набрал 90%, в то время как MINI GPT-4O на 88% (выше лучше). Для сравнения, GPT-4.5-недавно выпущенная модель Openai-набирает всего 63%.

Тот факт, что инструменты поиска с ИИ более точны, чем традиционные модели ИИ, не обязательно удивителен-теоретически, поиск GPT-4O может просто найти правильный ответ. Тем не менее, веб -поиск не делает галлюцинации решающей проблемой. Помимо их фактической точности, инструменты поиска искусственного интеллекта также имеют тенденцию к борьбе с короткими навигационными запросами (такими как «Обозрение Лейкерс сегодня»), и недавние сообщения предполагают, что цитаты Chatgpt не всегда надежны.

API ответов также включает в себя утилиту поиска файлов, которая может быстро сканировать по файлам в базах данных компании для получения информации. (OpenAI утверждает, что он не будет обучать модели в этих файлах.) Кроме того, разработчики, использующие API ответов, могут использовать модель компьютерного агента (CUA) Openai (CUA), которая поддерживает оператор. Модель генерирует действия мыши и клавиатуры, позволяя разработчикам автоматизировать задачи использования компьютера, такие как ввод данных и рабочие процессы приложений.

По словам Openai, предприятия могут при желании запускать модель CUA, которая выпускается в предварительном просмотре исследований, местно в своих собственных системах. Потребительская версия CUA, доступная в операторе, может предпринять только действия в Интернете.

Чтобы быть ясным, API ответов не решает все технические проблемы, преследующие сегодня агенты искусственного интеллекта.

В то время как инструменты поиска с ИИ более точны, чем традиционные модели искусственного интеллекта-факт, который не удивительный, учитывая, что они могут просто искать правильный ответ-веб-поиск не делает галлюцинации ИИ решенной проблемой. Поиск GPT-4O по-прежнему получает 10% фактических вопросов. Помимо их точности, инструменты поиска искусственного интеллекта также имеют тенденцию бороться с короткими навигационными запросами (такими как «Лейкерс» сегодня »), и недавние сообщения предполагают, что цитаты Chatgpt не всегда надежны.

В сообщении в блоге, предоставленном TechCrunch, Openai сказал, что модель CUA «еще не очень надежна для автоматизации задач в операционных системах» и что она подвержена «непреднамеренным» ошибкам.

Тем не менее, Openai сказал, что это ранние итерации их агентских инструментов, и он постоянно работает над их улучшением.

Наряду с API ответа, OpenAI выпускает инструментарий с открытым исходным кодом под названием Agents SDK, который предлагает разработчикам бесплатные инструменты для интеграции моделей с их внутренними системами, создания гарантий и мониторинга деятельности агента AI для отладки и оптимизации. Агенты SDK-это своего рода продолжение Swarm’s Swarm’s, основа для многоагентной оркестровки, которую компания выпустила в конце прошлого года.

Godemont сказал, что он надеется, что Openai сможет преодолеть разрыв между демонстрациями и продуктами агента ИИ в этом году, и что, по его мнению, «агенты являются наиболее эффективным применением ИИ, которое произойдет». Это перекликается с генеральным директором Openai Sam Altman, сделанным в январе: что 2025 год — это год, когда агенты ИИ вступают в рабочую силу.

Независимо от того, действительно ли 2025 год становится «Годом агента искусственного интеллекта», последние выпуски Openai показывают, что компания хочет пережить от ярких демонстраций агента на эффективные инструменты.