Функция генерации изображений Chatgpt получает обновление

Во время прямой трансляции во вторник генеральный директор Openai Сэм Альтман объявил о первом крупном обновлении возможностей Catgpt в течение более года.

CHATGPT теперь может использовать модель GPT-4O компании, чтобы изначально создавать и изменять изображения и фотографии. GPT-4O уже давно подкрепляет платформу чат-ботов на основе AI, но до сих пор модель смогла генерировать и редактировать только текст, а не изображения.

Altman сказал, что GPT-4O Generation Generation сегодня живет в Chatgpt и Sora, продукте GPTAI, для подписчиков компании Pro Pro. Openai говорит, что эта функция скоро развернется к плюс и бесплатным пользователям CHATGPT, а также разработчикам, использующим услугу API компании.

GPT-4O с выводом изображения «мыслит» немного дольше, чем модель генерации изображения, которую он эффективно заменяет, Dall-E 3, чтобы сделать то, что Openai описывает как более точные и подробные изображения. GPT-4O может редактировать существующие изображения, в том числе изображения с людьми в них-преобразовать их или «внедрять» детали, такие как передний план и фоновые объекты.

OpenAI не обнаружил, какие данные изображения он использовал для обеспечения новых возможностей генерации изображений. Многие генеративные поставщики ИИ рассматривают данные обучения как конкурентное преимущество и поэтому сохраняют их, а также любую информацию, связанную с ним близко к груди. Но данные обучения также являются потенциальным источником судебных исков, связанных с IP, еще одним препятствием для компаний, которые можно много раскрывать.

OpenAI предлагает форму отказа, которая позволяет создателям просить, чтобы их работы были удалены из его обучающих наборов данных. Компания также говорит, что она уважает просьбы запретить своих ботов в Интернете собирать учебные данные, включая изображения, с веб-сайтов.

Обновленная функция GeatGPT генерации изображений следует по пятам экспериментального нативного вывода изображения Google для Gemini 2.0 Flash, одной из флагманских моделей компании. Мощная особенность стала вирусной в социальных сетях, но не обязательно по лучшим причинам. Компонент изображения Gemini 2.0 Flash, оказался, имел мало ограждений, что позволило людям удалять водяные знаки и создавать изображения с изображением защищенных авторских прав.