OpenAI выпустила новую серию моделей GPT в апреле, которая сосредоточена на потребностях ИИ разработчика, включая улучшения в разработке и кодировании фронта в целом, а также способность следовать инструкциям и длинным контекстам.
«Мы рады объявить GPT-4.1, который является семьей моделей в API, которые были обучены только для разработчиков»,-сказал главный сотрудник по продукту Openai Кевин Вейл во время лейбры 14 апреля о новостях. «Они даже встречаются или побеждают GPT-4.5 кучей ключевых способов. И впервые у них длинный контекст».
В нижней части сообщения компании сообщают, что в нижней части модели GPT-4.1 можно просмотреть прямую трансляцию.
Модели GPT-4.1 Best GPT-4O в различных задачах кодирования, включая агентское решение задач кодирования, кодирование фронта, что делает меньшее количество посторонних изменений, выполняемых форматами различий и обеспечение постоянного использования инструмента, пишет компания.
16 апреля компания ИИ также запустила две новые модели рассуждений:
- OpenAI O3, который предлагает «сильную производительность в кодировании, математике, науке и визуальном понимании».
- Openai O4-Mini, которая представляет собой меньшую, более быструю модель, которая обеспечивает результаты-особенно в области математики, кодирования и визуальных задач-по более низкой стоимости, заявила компания.
Модели рассуждений — это первые модели OpenAI, которые могут «думать» с изображениями, по словам компании. Это в основном означает, что они не просто «видят» изображение, но могут интегрировать визуальную информацию непосредственно из изображения в свою цепочку рассуждений. Например, разработчики могут загружать изображения доски в модели, и они могут интерпретировать информацию, а не просто видеть доску с помощью Scribbles.
Модели OpenAI O3 и O4 также могут самостоятельно использовать все инструменты CHATGPT, включая просмотр веб -страниц, Python, понимание изображений и генерацию изображений для более эффективного и независимо решать сложные проблемы многоэтапных задач.
Модели рассуждений доступны сегодня для пользователей Catgpt Plus, PR и команды (O3, O4-Mini, O4-Mini-High), заменив модели O1, O3-Mini и O3-Mini High. O3-Pro последует через несколько недель, но сейчас у пользователей Pro все еще есть доступ к O1-Pro.
Наконец, 16 апреля компания AI также запустила Codex CLI. Codex CLI — это легкий агент кодирования с открытым исходным кодом, который может работать локально в терминале разработчика.
Когда использовать какие модели GPT-4.1
Модели GPT-4.1 доступны только через платформу API Openai, а не в общедоступном Chatgpt. Тем не менее, многие из улучшений в следующих инструкциях, кодировании и интеллекте постепенно включены в последнюю версию GPT-4O.
Что касается новых моделей, Мишель Покрасс, которая работает в технической команде Openai пост-тренировок, предложенной во время прямой трансляции, когда использовать эту модель.
«При принятии решения о том, когда их использовать, мы рекомендуем начать с 4.1. Это наша мощность для этих трех измерений: кодирование, следующая инструкция и длинный контекст», — сказал Покрасс. «Но если вам нужно что -то немного быстрее, может быть, для немного более простого использования, я бы порекомендовал 4.1 Mini».
Она добавила, что модель Nano-первая Openai-является «абсолютной рабочей лошадкой» для таких задач, как автоматическая полная, классификация или извлечение информации из длинных документов.
Что GPT-4.1 предлагает разработчикам
Согласно сообщению компании, для разработчиков frontend модели GPT-4.1 предлагают улучшения для кодирования фронта.
«GPT -4.1 также существенно улучшается при GPT -4O в кодировании фронта и способен создавать веб -приложения, которые являются более функциональными и эстетически приятными», — говорится в сообщении. «В наших концентрациях на лицу платные специалисты-специалисты пострадали предпочитали веб-сайты GPT-4.1 в 80% времени GPT-4O».
Модели могут похвастаться большим контекстом, поддерживая до 1 миллиона токенов контекста. Openai также сказал, что GPT-4.1 может лучше использовать этот контекст из-за его улучшенного понимания длинного контекста.
«В то время как тесты предоставляют ценную информацию, мы обучили эти модели сосредоточиться на утилите реального мира»,-говорится в сообщении. «Тесное сотрудничество и партнерство с сообществом разработчиков позволило нам оптимизировать эти модели для задач, которые наиболее важны для их приложений».
Это сделало модели более надежными. Добавьте к этому более длительное понимание контекста моделей GPT-4.1, и в результате модели стали более эффективными, чем предыдущие поколения при питании агентов или систем ИИ, которые автоматизируют задачи.
«Мы обучили GPT -4.1 надежно посещать информацию по всей длине 1 миллиона контекстов», — говорится в сообщении в блоге. «Мы также обучили его быть гораздо более надежным, чем GPT-4O, чтобы заметить соответствующий текст, и игнорировать отвлекающих факторов по длинной и короткой длине контекста. Понимание длительного контекста является важнейшей возможностью для приложений по юридическому, кодированию, поддержке клиентов и многим другим доменам».
Модель GPT-4.1 также более надежна в различных кодах в различных форматах, что будет важно для разработчиков API, которые хотят редактировать большие файлы, отмечается в сообщении.
«Мы специально обучили GPT -4.1 более надежно следовать форматам различий, что позволяет разработчикам сохранять как стоимость, так и задержку, только путем изменения линий модели модели, а не переписывая весь файл», — говорится в сообщении.
Большая ничья, однако, может быть то, что модели GPT-4.1 обещают лучшую производительность в более низкой стоимости.
Стоит отметить, что эти модели имеют «обновленное отсечение знаний в июне 2024 года», заявила компания.
Модели GPT-4.1 превосходят GPT-4O и GPT-4O Mini по всем направлениям, «с большими успехами в кодировании и обучении следующим образом»,-говорится в сообщении в блоге об этом сообщении.
«В сочетании с примитивами, такими как ответы API»,-отмечается в сообщении, «разработчики теперь могут создавать агенты, которые более полезны и надежны при разработке программного обеспечения в реальном мире, извлекая информацию из больших документов, разрешает запросы клиентов с минимальными ручными и другими сложными задачами».
Оценка моделей GPT-4.1
Чтобы создать модели GPT-4.1, команда OpenAI создала внутреннюю оценку для моделей, которые основали общие проблемы разработчиков, такие как оценка способности моделей:
- Используйте конкретный формат, такой как XML, YAML или отметка.
- Следуйте упорядоченным инструкциям.
- Понять негативные инструкции, в которых указывается, какого поведения должна избегать модели.
- Обурите модель, чтобы сказать «Я не знаю», если запрошенная информация недоступна.
Сообщение в блоге также включает подробную информацию о тестах новых моделей
Первая нано -модель Openai
Openai также выпустил свою первую модель Nano, GPT-4.1 Mini.
«Он соответствует или превышает GPT -4O в разведывании Evals, одновременно снижая задержку почти вдвое и снижая стоимость на 83%», — говорится в сообщении компании. «Для задач, которые требуют низкой задержки, GPT -4.1 Nano является нашей самой быстрой и дешевой доступной моделью».
Далее в сообщении говорилось, что новая модель Nano предлагает «исключительные характеристики при небольшом размере с его окном токена 1 миллион токенов и набирает 80,1% по MMLU, 50,3% на GPQA и 9,8% по кодированию полиглот — даже выше, чем MINI GPT -4O».
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Loraine Lawson — ветеран -репортер, который в течение 25 лет освещал технологические проблемы от интеграции данных до безопасности. Прежде чем присоединиться к новому стеку, она работала редактором Banking Technology Site Bank Automation News. Она … читайте больше от Лорейн Лоусон