OpenAI запускает новую модель GPT-5 для своего агента кодирования Codex

Codex, ответ Openai на такие, как Github Copilot, Claude Code и аналогичные агенты по кодированию искусственного интеллекта, сегодня получает крупное обновление.

В основе этого запуска лежит GPT-5-Codex, версия новейших моделей GPT-5 OpenAI, которую компания оптимизирует специально для инженерии Agentic Software. И хотя сама новая модель заслуживает недостатков, команда также добавила множество дополнительных функций в Codex. К ним относятся перестроенный CLI Codex, который теперь сосредоточен на агентских рабочих процессах, новом расширении IDE, которое привносит Codex к таким инструментам, как VS -код, курсор и другие вики кода VS, интеграция с GitHub для обзоров кода и обновления рабочих потоков в веб -сайте Codex.

Доступ к Codex включен для пользователей OpenAI с планами CHATGPT Plus, Pro, Business, EDU и Enterprise, с масштабированием ограничений использования в зависимости от того, на что подписывает пользователь. OpenAI явно отмечает, что плюс, EDU и бизнес -планы будут охватывать «несколько целенаправленных сессий кодирования каждую неделю», в то время как пользователи Pro Plan могут ожидать «полную рабочую неделю в нескольких проектах».

В ближайшее время, когда пользователи CODEX CLI также смогут использовать API для оплаты Codex, пользователи CLI также смогут использовать API для оплаты Codex (хотя это может быстро стать дорогим).

GPT-5-Codex

Стоит отметить, что, хотя GPT-5 получил несколько приветственного приветствия, отчасти из-за своего модельного маршрутизатора, который иногда, казалось, приоритет экономии денег Openai при затратах на вывод по сравнению с улучшенными результатами, GPT-5-Codex имеет маршрутизатор. Это автономная модель, разработанная явно для Codex (хотя в ближайшее время она станет доступной в API OpenAI).

На брифинге для прессы перед сегодняшним запуском Openai подчеркнула, что для рассуждения над сложными проблемами GPT-5-Codex использует динамическое количество рассуждений, и что в собственных тестах компании модель смогла автономно работать над проблемой до семи часов (хотя это не жесткий каплей).

Чтобы помочь руководству моделью, GPT-5-Codex теперь использует файл Agent.md, который стал де-факто отраслевым стандартом для предоставления моделей с руководящими принципами кодирования и другими инструкциями.

«Модель сочетает в себе два основных навыка для агента по кодированию: сочетание с разработчиками в интерактивных сессиях и постоянное, независимое выполнение по более длинным задачам», — пишет компания в своем объявлении. «Это означает, что Codex будет чувствовать себя более четким по небольшим, четко определенным запросам или во время общения с ним, и будет работать дольше на сложных задачах, таких как большие рефактории».

Изображение предоставлено: openai.

Поскольку у команды было немного дополнительного времени для создания этой модели после запуска GPT-5, она смогла оптимизировать производительность кодирования модели.

Цитрицы OpenAI показывают относительно небольшое улучшение в тесте SWE-Bench, которое проверяет, может ли модель решить проблемы из набора запросов на притяжение GitHub. При 74,5%это очень респектабельный балл (здесь есть некоторые расхождения, причем некоторые данные Openai ранее сообщались, когда он запустил GPT-5, потому что инфраструктура Openai не смогла выполнить весь набор задач).

В этом контексте, что более важно, это то, что GPT-5-Codex особенно хорошо в рефакторинг-коде, легко подчеркивая GPT-5 в его режиме высокого рассуждения.

Обзоры кода кодекса в GitHub

Скорее всего, поэтому команда чувствовала, что сейчас было подходящим временем для запуска агента рассмотрения кода GitHub. «GPT-5-Codex был обучен специально для проведения обзоров кода и поиска критических недостатков»,-пояснил Openai. «При рассмотрении он навигает на вашу кодовую базу, причины через зависимости и запускает ваш код и тесты, чтобы проверить правильность».

В то время как 13,7% комментариев, оставленных GPT-5 (высоким), были неверными, например, только 4,4% комментариев GPT-5-Codex были просто неправильными. Между тем, 52% комментариев GPT-5-Codex теперь считались «высокой воздействием» командой OpenAI, в то время как только 39% были для GPT-5 (высокий).

Изображение предоставлено: openai.

Когда дело доходит до работы с проблемами GitHub напрямую и работе над одобрениями кода, это цифры, которые будут иметь значение.

Как и в случае с аналогичными инструментами, разработчики просто упоминают «@Codex Review» в своих запросах на притяжение и рассказывают агенту, что просмотреть (подумайте «@Codex Review для уязвимостей безопасности»).

«В Openai Codex теперь рассматривает подавляющее большинство наших PRS, ловив сотни проблем каждый день — часто до начала обзора человека. Это было ключом к тому, чтобы позволить команде Codex быстро двигаться с большей уверенностью», — говорит компания.

Поделитесь больше со своим агентом

Что касается обновлений для остальной части экосистемы Codex, то одна особенность, которая выделяется, заключается в том, что разработчики теперь могут прикреплять и делиться изображениями — независимо от того, являются ли это скриншоты, каркасы или диаграммы — с агентом кодирования в CLI и веб -версии, чтобы обеспечить дополнительный контекст.

Что касается CLI, Codex теперь также использует список дел, чтобы отслеживать его прогресс, и команда говорит, что у него улучшены инструментальные вызовы, а также пользовательский интерфейс для следствия с тем, что делает модель, когда она называет эти инструменты и создает различия. В настоящее время существует три явных режима утверждения: только для чтения с явным утверждением, Auto с полным доступом к рабочей области, но требует одобрения за пределами этого рабочего пространства, и полный доступ с Codex может читать файлы в любом месте и запускать команды с доступом к сети.

Для Codex Web команда подчеркивает, что она улучшила общую облачную инфраструктуру, на которой работает сервис, с улучшением кэширования, снижающим среднее время выполнения новых задач и последующих действий на 90%.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Прежде чем присоединиться к новому стеку в качестве старшего редактора для ИИ, Фредерик был редактором предприятия в TechCrunch, где он освещал все, от роста облака и самых ранних дней Kubernetes до появления квантовых вычислений …. Подробнее от Frederic Lardinois

Разработка сайтов в Гомеле

Добавить комментарий Отменить ответ

Похожие записи

Является ли разработка на основе спецификаций ключом к автоматизации инфраструктуры?

Обзор разработчика Warp для Windows, приложения для терминала AI

Прогулка разработчика Aider, агента с открытым исходным кодом CLI

Snowflake, Salesforce запустите новый стандарт для объединения данных для искусственного интеллекта

Последовательность в масштабе: объединение временного и югабайтб

Повышение производительности Valkey 8.1 Разрушает базы данных в памяти

Как ядра Linux занимается отслеживанием проблем безопасности CVE

Vibe Coding и вы

Почему до 70% команд разработчиков платформ не могут добиться результата

Келси Хайтауэр, Эсвар Бала из AWS на эволюции Open Source

Кубический: создайте пользовательское распределение Linux на основе Ubuntu

GitHub и Microsoft используют ИИ для решения долгового кризиса в сфере безопасности

Вам тоже может быть интересно:

Высокопроизводительный суперконденсатор, изготовленный из переработанных бутылок с водой

Ученые открывают резиновую полосу, которая генерирует электричество от тепла тела

«Матрица повсюду»: Cinema делает ставки на погружение

Новый химический состав катода сокращает саморазряд в йод-цинковых батареях сетчатого типа

Солнечный свет разделен на две части: органический слой обещает скачок в эффективности солнечной энергии

Европа Hyperloop Test достиг новой скорости в голландском испытании

Искусственный нерв с экологически чистым дизайном транзистора показывает перспективу для интерфейсов мозговых машин

Фильтры, вдохновленные волосами носа и носовой слизи, чище воздуха

Новый нанопластичный прокладывает путь для устойчивого уличного освещения

Самовосстанавливающая литиевая батарея растягивается, выживает проколы и порезы

Крошечное устройство обрабатывает движение рук в режиме реального времени, сохраняя визуальные воспоминания с эффективностью, похожей на мозг

Английский футбол для дебюта полуавтоматической офсайды в Кубке Англии