OpenAI выпускает новые модели, обученные разработчикам

OpenAI выпустила новую серию моделей GPT в апреле, которая сосредоточена на потребностях ИИ разработчика, включая улучшения в разработке и кодировании фронта в целом, а также способность следовать инструкциям и длинным контекстам.

«Мы рады объявить GPT-4.1, который является семьей моделей в API, которые были обучены только для разработчиков»,-сказал главный сотрудник по продукту Openai Кевин Вейл во время лейбры 14 апреля о новостях. «Они даже встречаются или побеждают GPT-4.5 кучей ключевых способов. И впервые у них длинный контекст».

В нижней части сообщения компании сообщают, что в нижней части модели GPT-4.1 можно просмотреть прямую трансляцию.

Модели GPT-4.1 Best GPT-4O в различных задачах кодирования, включая агентское решение задач кодирования, кодирование фронта, что делает меньшее количество посторонних изменений, выполняемых форматами различий и обеспечение постоянного использования инструмента, пишет компания.

16 апреля компания ИИ также запустила две новые модели рассуждений:

OpenAI O3, который предлагает «сильную производительность в кодировании, математике, науке и визуальном понимании».
Openai O4-Mini, которая представляет собой меньшую, более быструю модель, которая обеспечивает результаты-особенно в области математики, кодирования и визуальных задач-по более низкой стоимости, заявила компания.

Модели рассуждений — это первые модели OpenAI, которые могут «думать» с изображениями, по словам компании. Это в основном означает, что они не просто «видят» изображение, но могут интегрировать визуальную информацию непосредственно из изображения в свою цепочку рассуждений. Например, разработчики могут загружать изображения доски в модели, и они могут интерпретировать информацию, а не просто видеть доску с помощью Scribbles.

Модели OpenAI O3 и O4 также могут самостоятельно использовать все инструменты CHATGPT, включая просмотр веб -страниц, Python, понимание изображений и генерацию изображений для более эффективного и независимо решать сложные проблемы многоэтапных задач.

Модели рассуждений доступны сегодня для пользователей Catgpt Plus, PR и команды (O3, O4-Mini, O4-Mini-High), заменив модели O1, O3-Mini и O3-Mini High. O3-Pro последует через несколько недель, но сейчас у пользователей Pro все еще есть доступ к O1-Pro.

Наконец, 16 апреля компания AI также запустила Codex CLI. Codex CLI — это легкий агент кодирования с открытым исходным кодом, который может работать локально в терминале разработчика.

Когда использовать какие модели GPT-4.1

Модели GPT-4.1 доступны только через платформу API Openai, а не в общедоступном Chatgpt. Тем не менее, многие из улучшений в следующих инструкциях, кодировании и интеллекте постепенно включены в последнюю версию GPT-4O.

Что касается новых моделей, Мишель Покрасс, которая работает в технической команде Openai пост-тренировок, предложенной во время прямой трансляции, когда использовать эту модель.

«При принятии решения о том, когда их использовать, мы рекомендуем начать с 4.1. Это наша мощность для этих трех измерений: кодирование, следующая инструкция и длинный контекст», — сказал Покрасс. «Но если вам нужно что -то немного быстрее, может быть, для немного более простого использования, я бы порекомендовал 4.1 Mini».

Она добавила, что модель Nano-первая Openai-является «абсолютной рабочей лошадкой» для таких задач, как автоматическая полная, классификация или извлечение информации из длинных документов.

Что GPT-4.1 предлагает разработчикам

Согласно сообщению компании, для разработчиков frontend модели GPT-4.1 предлагают улучшения для кодирования фронта.

«GPT -4.1 также существенно улучшается при GPT -4O в кодировании фронта и способен создавать веб -приложения, которые являются более функциональными и эстетически приятными», — говорится в сообщении. «В наших концентрациях на лицу платные специалисты-специалисты пострадали предпочитали веб-сайты GPT-4.1 в 80% времени GPT-4O».

Модели могут похвастаться большим контекстом, поддерживая до 1 миллиона токенов контекста. Openai также сказал, что GPT-4.1 может лучше использовать этот контекст из-за его улучшенного понимания длинного контекста.

«В то время как тесты предоставляют ценную информацию, мы обучили эти модели сосредоточиться на утилите реального мира»,-говорится в сообщении. «Тесное сотрудничество и партнерство с сообществом разработчиков позволило нам оптимизировать эти модели для задач, которые наиболее важны для их приложений».

Это сделало модели более надежными. Добавьте к этому более длительное понимание контекста моделей GPT-4.1, и в результате модели стали более эффективными, чем предыдущие поколения при питании агентов или систем ИИ, которые автоматизируют задачи.

«Мы обучили GPT -4.1 надежно посещать информацию по всей длине 1 миллиона контекстов», — говорится в сообщении в блоге. «Мы также обучили его быть гораздо более надежным, чем GPT-4O, чтобы заметить соответствующий текст, и игнорировать отвлекающих факторов по длинной и короткой длине контекста. Понимание длительного контекста является важнейшей возможностью для приложений по юридическому, кодированию, поддержке клиентов и многим другим доменам».

Модель GPT-4.1 также более надежна в различных кодах в различных форматах, что будет важно для разработчиков API, которые хотят редактировать большие файлы, отмечается в сообщении.

«Мы специально обучили GPT -4.1 более надежно следовать форматам различий, что позволяет разработчикам сохранять как стоимость, так и задержку, только путем изменения линий модели модели, а не переписывая весь файл», — говорится в сообщении.

Большая ничья, однако, может быть то, что модели GPT-4.1 обещают лучшую производительность в более низкой стоимости.

Стоит отметить, что эти модели имеют «обновленное отсечение знаний в июне 2024 года», заявила компания.

Модели GPT-4.1 превосходят GPT-4O и GPT-4O Mini по всем направлениям, «с большими успехами в кодировании и обучении следующим образом»,-говорится в сообщении в блоге об этом сообщении.

«В сочетании с примитивами, такими как ответы API⁠»,-отмечается в сообщении, «разработчики теперь могут создавать агенты, которые более полезны и надежны при разработке программного обеспечения в реальном мире, извлекая информацию из больших документов, разрешает запросы клиентов с минимальными ручными и другими сложными задачами».

Оценка моделей GPT-4.1

Чтобы создать модели GPT-4.1, команда OpenAI создала внутреннюю оценку для моделей, которые основали общие проблемы разработчиков, такие как оценка способности моделей:

Используйте конкретный формат, такой как XML, YAML или отметка.
Следуйте упорядоченным инструкциям.
Понять негативные инструкции, в которых указывается, какого поведения должна избегать модели.
Обурите модель, чтобы сказать «Я не знаю», если запрошенная информация недоступна.

Сообщение в блоге также включает подробную информацию о тестах новых моделей

Первая нано -модель Openai

Openai также выпустил свою первую модель Nano, GPT-4.1 Mini.

«Он соответствует или превышает GPT -4O в разведывании Evals, одновременно снижая задержку почти вдвое и снижая стоимость на 83%», — говорится в сообщении компании. «Для задач, которые требуют низкой задержки, GPT -4.1 Nano является нашей самой быстрой и дешевой доступной моделью».

Далее в сообщении говорилось, что новая модель Nano предлагает «исключительные характеристики при небольшом размере с его окном токена 1 миллион токенов и набирает 80,1% по MMLU, 50,3% на GPQA и 9,8% по кодированию полиглот — даже выше, чем MINI GPT -4O».

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Loraine Lawson — ветеран -репортер, который в течение 25 лет освещал технологические проблемы от интеграции данных до безопасности. Прежде чем присоединиться к новому стеку, она работала редактором Banking Technology Site Bank Automation News. Она … читайте больше от Лорейн Лоусон

Разработка сайтов в Гомеле

Добавить комментарий Отменить ответ

Похожие записи

Агент AI: недостающая часть в инженерии платформы

Hype Machine разбавляет агент AI

Руководство разработчика по языковым моделям

Вся ваша организация должна заботиться о затратах API

Почему безопасность Kubernetes имеет решающее значение для целостности GenAI

Red Hat Ansible и Hashicorp Terraform будут собраться вместе

Как терминал Warp помогает мне исправить сценарии и кодирование

Engflow делает C ++ строить 21x быстрее и программное обеспечение намного безопаснее

Разработчики не доверяют искусственному интеллекту, и это хорошо

Почему вы не можете отлаживать работающую квантовую компьютерную программу

Чтобы исправить инженерию платформы, создайте то, что на самом деле хотят пользователи

SolidJS Creator о детальной реактивности как следующем рубеже

Вам тоже может быть интересно:

Модифицированные перовскитные солнечные батареи сбора энергии из внутреннего флуоресцентного освещения

Носимые технологии позволяют пользователям управлять машинами и роботами во время движения

Новая технология дополненной реальности может превратить любую поверхность в клавиатуру

Дроны доставки могут скоро взлетать в США. Вот почему

Крошечное устройство обрабатывает движение рук в режиме реального времени, сохраняя визуальные воспоминания с эффективностью, похожей на мозг

Безопасное шифрование и дешифрование с люминесцентными перовскитами

Первый двухсторонний адаптивный интерфейс мозга-компьютер повышает эффективность связи

Отбрасывание до развертывания: как бистабильная механика разворачивает конструкции менее чем за секунду

3D-печать смолы образует как постоянные объекты, так и растворимые опоры

Система скрининга прохождения повышает безопасность в аэропортах по всей стране

Электромеханические строительные блоки обеспечивают быстрое прототипирование больших интерактивных структур

Судьи робота приходят в MLB. Вот как они работают