OpenAI теперь раскрывает больше мышления модели своей модели O3-Mini

В ответ на давление со стороны конкурентов, включая китайскую компанию AI Deepseek, Openai меняет способ, которым его новейшая модель ИИ, O3-Mini, передает свой пошаговый процесс «мысли».

В четверг Openai объявила, что бесплатные и оплачиваемые пользователи Chatgpt, платформы Chatbot на основе AI, будут иметь обновленную «цепочку мысли», которая показывает больше шагов «рассуждений» модели и как она пришла к ответам на вопросы. По данным Openai, подписчики премиум-класса, которые используют O3-Mini в конфигурации «высокие рассуждения».

«Мы представляем обновленные [chain of thought] Для O3-Mini, предназначенного для того, чтобы людям было легче понять, как думает модель »,-сказал представитель Openai по электронной почте. «С этим обновлением вы сможете следовать рассуждениям модели, давая вам большую ясность и уверенность в ее ответах».

Кредиты изображения:Openai

Модели рассуждений, такие как O3-Mini, тщательно проверяют факты, прежде чем выдавать результаты, что помогает им избежать некоторых ловушек, которые обычно отключают модели. Компромисс заключается в том, что модели рассуждений занимают немного больше времени, чтобы прийти к решениям-как правило, до минуты дольше.

Модель Deepseek R1, модель «рассуждений» в соответствии с O3-Mini, показывает свой полный мыслительный процесс, который, как утверждают многие исследователи ИИ, является предпочтительным подходом. В дополнение к облегчению изучения модели, шаги рассуждений обеспечивают лучший пользовательский опыт в определенных ситуациях, помогая указать, когда модель может быть правой или неправильной — треке.

OpenAI решил не показывать полные шаги рассуждения для O3-Mini и его предшественников, O1 и O1-Mini, отчасти из-за конкурентных причин. Вместо этого пользователи видели только резюме шагов рассуждений — резюме, которые иногда были ошибочными.

Openai по-прежнему не показывает полные шаги рассуждения O3-Mini, но компания заявила, что «нашла баланс»: O3-Mini может «свободно думать», а затем организовать свои «мысли» в более подробные резюме.

«Чтобы улучшить ясность и безопасность, мы добавили дополнительный шаг после обработки, где модель рассматривает необработанную цепочку мышления, удаляя любой небезопасный контент, а затем упрощает любые сложные идеи»,-продолжил представитель Openai. «Кроме того, этот шаг после обработки позволяет неанглийским пользователям получать цепочку мышления на своем родном языке, создавая более доступный и дружелюбный опыт».

В Reddit AMA на прошлой неделе Кевин Вейл, директор по продукту Openai, намекнул, что произошли изменения.

«Мы работаем над тем, чтобы показать кучу больше, чем мы показываем сегодня — [showing the model thought process] Будет очень, очень скоро », — сказал он. «TBD на всех — показывая всю цепочку мышления, приводит к конкурентной дистилляции, но мы также знаем, что люди (по крайней мере, власти) хотят этого, поэтому мы найдем правильный способ сбалансировать ее».