OpenAI запускает новую модель GPT-5 для своего агента кодирования Codex

Codex, ответ Openai на такие, как Github Copilot, Claude Code и аналогичные агенты по кодированию искусственного интеллекта, сегодня получает крупное обновление.

В основе этого запуска лежит GPT-5-Codex, версия новейших моделей GPT-5 OpenAI, которую компания оптимизирует специально для инженерии Agentic Software. И хотя сама новая модель заслуживает недостатков, команда также добавила множество дополнительных функций в Codex. К ним относятся перестроенный CLI Codex, который теперь сосредоточен на агентских рабочих процессах, новом расширении IDE, которое привносит Codex к таким инструментам, как VS -код, курсор и другие вики кода VS, интеграция с GitHub для обзоров кода и обновления рабочих потоков в веб -сайте Codex.

Доступ к Codex включен для пользователей OpenAI с планами CHATGPT Plus, Pro, Business, EDU и Enterprise, с масштабированием ограничений использования в зависимости от того, на что подписывает пользователь. OpenAI явно отмечает, что плюс, EDU и бизнес -планы будут охватывать «несколько целенаправленных сессий кодирования каждую неделю», в то время как пользователи Pro Plan могут ожидать «полную рабочую неделю в нескольких проектах».

В ближайшее время, когда пользователи CODEX CLI также смогут использовать API для оплаты Codex, пользователи CLI также смогут использовать API для оплаты Codex (хотя это может быстро стать дорогим).

GPT-5-Codex

Стоит отметить, что, хотя GPT-5 получил несколько приветственного приветствия, отчасти из-за своего модельного маршрутизатора, который иногда, казалось, приоритет экономии денег Openai при затратах на вывод по сравнению с улучшенными результатами, GPT-5-Codex имеет маршрутизатор. Это автономная модель, разработанная явно для Codex (хотя в ближайшее время она станет доступной в API OpenAI).

На брифинге для прессы перед сегодняшним запуском Openai подчеркнула, что для рассуждения над сложными проблемами GPT-5-Codex использует динамическое количество рассуждений, и что в собственных тестах компании модель смогла автономно работать над проблемой до семи часов (хотя это не жесткий каплей).

Чтобы помочь руководству моделью, GPT-5-Codex теперь использует файл Agent.md, который стал де-факто отраслевым стандартом для предоставления моделей с руководящими принципами кодирования и другими инструкциями.

«Модель сочетает в себе два основных навыка для агента по кодированию: сочетание с разработчиками в интерактивных сессиях и постоянное, независимое выполнение по более длинным задачам», — пишет компания в своем объявлении. «Это означает, что Codex будет чувствовать себя более четким по небольшим, четко определенным запросам или во время общения с ним, и будет работать дольше на сложных задачах, таких как большие рефактории».

Изображение предоставлено: openai.

Поскольку у команды было немного дополнительного времени для создания этой модели после запуска GPT-5, она смогла оптимизировать производительность кодирования модели.

Цитрицы OpenAI показывают относительно небольшое улучшение в тесте SWE-Bench, которое проверяет, может ли модель решить проблемы из набора запросов на притяжение GitHub. При 74,5%это очень респектабельный балл (здесь есть некоторые расхождения, причем некоторые данные Openai ранее сообщались, когда он запустил GPT-5, потому что инфраструктура Openai не смогла выполнить весь набор задач).

В этом контексте, что более важно, это то, что GPT-5-Codex особенно хорошо в рефакторинг-коде, легко подчеркивая GPT-5 в его режиме высокого рассуждения.

Обзоры кода кодекса в GitHub

Скорее всего, поэтому команда чувствовала, что сейчас было подходящим временем для запуска агента рассмотрения кода GitHub. «GPT-5-Codex был обучен специально для проведения обзоров кода и поиска критических недостатков»,-пояснил Openai. «При рассмотрении он навигает на вашу кодовую базу, причины через зависимости и запускает ваш код и тесты, чтобы проверить правильность».

В то время как 13,7% комментариев, оставленных GPT-5 (высоким), были неверными, например, только 4,4% комментариев GPT-5-Codex были просто неправильными. Между тем, 52% комментариев GPT-5-Codex теперь считались «высокой воздействием» командой OpenAI, в то время как только 39% были для GPT-5 (высокий).

Изображение предоставлено: openai.

Когда дело доходит до работы с проблемами GitHub напрямую и работе над одобрениями кода, это цифры, которые будут иметь значение.

Как и в случае с аналогичными инструментами, разработчики просто упоминают «@Codex Review» в своих запросах на притяжение и рассказывают агенту, что просмотреть (подумайте «@Codex Review для уязвимостей безопасности»).

«В Openai Codex теперь рассматривает подавляющее большинство наших PRS, ловив сотни проблем каждый день — часто до начала обзора человека. Это было ключом к тому, чтобы позволить команде Codex быстро двигаться с большей уверенностью», — говорит компания.

Поделитесь больше со своим агентом

Что касается обновлений для остальной части экосистемы Codex, то одна особенность, которая выделяется, заключается в том, что разработчики теперь могут прикреплять и делиться изображениями — независимо от того, являются ли это скриншоты, каркасы или диаграммы — с агентом кодирования в CLI и веб -версии, чтобы обеспечить дополнительный контекст.

Что касается CLI, Codex теперь также использует список дел, чтобы отслеживать его прогресс, и команда говорит, что у него улучшены инструментальные вызовы, а также пользовательский интерфейс для следствия с тем, что делает модель, когда она называет эти инструменты и создает различия. В настоящее время существует три явных режима утверждения: только для чтения с явным утверждением, Auto с полным доступом к рабочей области, но требует одобрения за пределами этого рабочего пространства, и полный доступ с Codex может читать файлы в любом месте и запускать команды с доступом к сети.

Для Codex Web команда подчеркивает, что она улучшила общую облачную инфраструктуру, на которой работает сервис, с улучшением кэширования, снижающим среднее время выполнения новых задач и последующих действий на 90%.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Прежде чем присоединиться к новому стеку в качестве старшего редактора для ИИ, Фредерик был редактором предприятия в TechCrunch, где он освещал все, от роста облака и самых ранних дней Kubernetes до появления квантовых вычислений …. Подробнее от Frederic Lardinois

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *