Является ли GPT-5-кошер или кошмар по обслуживаемости?

Прошло несколько недель с тех пор, как последняя модель Openai, GPT-5, была выпущена в смешанные обзоры-один из выдающихся разработчиков frontend даже выполнял 180 и полностью изменил свою мелодию в течение нескольких дней. Но теперь, когда разработчики успели провести новую модель через его шаги, мы можем лучше определить, превосходно ли GPT-5 в кодировании frontend », как утверждал Openai.

Я обратился в Openai с ряд вопросов, основанных на разработке фронта. Ишаан Сингал, исследователь Openai, ответил по электронной почте. Сингал, который ранее работал инженером-программистом в Stripe и Microsoft, сказал мне, что ранняя обратная связь по GPT-5 была положительной, [but] Это все еще первые дни ».

Для моего первого вопроса я отметил, что в Руководстве по подсказке GPT-5 существует три рекомендуемые рамки: next.js (TypeScript), React и HTML. Я спросил, было ли какое-либо сотрудничество с следующей. JS и React Project Teams, чтобы оптимизировать GPT-5 для этих рамок?

«Мы выбрали эти рамки на основе их популярности и общности, но мы не сотрудничали напрямую с следующей. JS или React Teams на GPT-5»,-ответил Сингл.

Мы знаем, что Vercel, компания, которая пастушат в рамках следующего.js, является поклонником GPT-5. В день запуска он назывался GPT-5 «лучшая модель AI Frondend». Таким образом, здесь происходит хороший Quid Pro quo-GPT-5 смог стать экспертом в Next.js из-за его популярности, что, по-видимому, увеличивает его популярность еще больше. Это помогает как Openai, так и Vercel.

Пример «организации правил редактирования кода для GPT-5» из Руководства по подсказке GPT-5 OpenAI.

Но что, если вы не хотите использовать Next.js, или действительно какую -либо веб -структуру? Как GPT-5 Cope, если мне поручено создать сложное веб-приложение с использованием только основных технологий веб-платформы, я спросил, ссылаясь на HTML, CSS, JavaScript и любой из веб-API, перечисленных на MDN Mozilla.

«GPT-5 является сильной моделью общего назначения, а также может использоваться для изготовления веб-приложений только с HTML / CSS / JavaScript»,-ответил Сингал, довольно смутно.

Я попробовал другой угол с одним из моих следующих вопросов: могут ли разработчики, особенно разработчики frontend, «Train» GPT-5, чтобы использовать только технологии веб-платформы-т.е. использовать GPT-5, чтобы отучить себя за пределами структуры и/или REACT Reliance?

«GPT-5-самая управляемая модель, и разработчики добились больших успехов в быстром инженерии очень специфических поведения и результатов из этого»,-ответил Сингал. «Я не удивлюсь, если GPT-5 сможет помочь с этим вариантом использования».

«GPT-5-самая управляемая модель, и разработчики добились больших успехов в быстрого проектирования очень специфического поведения и результатов».
— Ишаан Сингал, исследователь Openai

Еще один не связанный ответ. Давайте попробуем еще раз: думает ли Openai, что GPT-5 может ускорить принятие более современных веб-нативных функций-таких как CSS Houdini и веб-компоненты-эти рамки часто затмевают?

«Это несколько зависит от приложения, использующего GPT-5, чтобы предоставить своим пользователям инструменты для создания компонентов пользовательского интерфейса»,-ответил Сингл. «Многие из этих приложений являются самоуверенными в том типе технологий и особенностей, которые они предпочитают, и я представляю, что влияет на это принятие».

Итак, что мы узнали до сих пор, так это то, что GPT-5, теоретически, может охватывать все варианты использования фронта, но многое зависит от инструментов, которые вы уже используете, и какого подхода вы, разработчик, хотите взять. Стоит также отметить, что OpenAI, сама по себе, «самоуверен» с инструментами, которые он рекомендует для GPT-5: next.js (TypeScript), React и HTML; И, для стиля, он рекомендует Tailwind CSS, Shadcn/UI и Radix Themes.

Что другие говорят о GPT-5?

Если OpenAI (понятно) сдерживает отчеты о реальном опыте разработчиков на данном этапе, компания Sonar Secult Code Sonar не так уж застенчива. Недавно он опубликовал обновленную информацию о своем отчете «Состояние кода» о личностях LLM, включающих новые данные на GPT-5.

Сонар пришел к выводу, что GPT-5 не является, согласно его тестам, лидером в области производительности кодирования.

Вот краткое изложение выводов Сонара:

  • Даже после прибытия GPT-5 Claude Sonnet 4 остается лидером производительности из всех моделей Sonar, протестированных.
  • GPT-5 генерирует «больший и более сложный объем кода, чем любая другая модель», что делает его «серьезной проблемой для пересмотра и поддержания».
  • Для каждой задачи GPT-5 успешно завершается, он вводит «значительно больше потенциальных дефектов, чем его конкуренты, что приводит к большому техническому долгу, качеству, качеству, безопасности и проверке».
  • GPT-5 производит самую низкую плотность уязвимостей, но у него «гораздо более высокая плотность запахов кода», то есть код слаб с точки зрения качества и обслуживания.

Сонар заключает, говоря, что GPT-5 является «несомненно, новой мощной силой в генерации кодов искусственного интеллекта», с предостережениями, что модель «несет значительную стоимость качества и представляет собой другой профиль соображений безопасности и надежности».

GPT-5 «несет значительную качественную стоимость и представляет другой профиль соображений безопасности и надежности».
-Отчет Sonar о GPT-5 и кодировании

Sonar также провел отдельное исследование режимов рассуждения GPT-5 в более чем 4400 задачах Java. Это выявило четкий компромисс: «Хотя более высокие рассуждения обеспечивают лучшую в своем классе функциональную производительность, он достигает этого, генерируя огромный объем сложного и труднодоступного кода».

Чтобы добавить второй внешний голос в анализ GPT-5, давайте вернемся к нашему старому другу YouTuber, Тео Брауну-он был выдающимся разработчиком, который сделал 180. Но потом через неделю он опубликовал видео под названием «Я ошибался в GPT-5». Так как же Браун сейчас относится к GPT-5?

В своем последнем видео о GPT-5, через пару недель после его запуска, Браун обвинил некоторые из проблем, с которыми он столкнулся в том, как GPT-5 реализован как в CHATGPT, так и в курсоре. «В реализации курсора сейчас много отказов UX, которые все еще распространяются», — добавил он. «Но, несмотря на все это, я все еще думаю, что 5 — невероятная модель. Это все еще та, которую я использую для всей работы, которую я выполняю».

Влияние по развитию фронта Тео Браун пытается решить, что он думает о GPT-5.

Таким образом, и Sonar, и Browne признают, что GPT-5 является мощным инструментом кодирования, хотя Sonar более критично относится к качеству и обслуживаемости кода.

Один выстрел или взгляд на техническое обслуживание?

Вернемся к ответам Openai на мои вопросы. Гид Openai также гласит, что «GPT-5 отлично подходит для строительства применений за один выстрел». Это кажется нацеленным на так называемых «кодировщиков Vibe»; Но я спросил, являются ли профессиональные разработчики также поощрять «одно выстрел» все в GPT-5, или они должны использовать более продуманный подход? Например, с учетом будущего обслуживания кода, как это было бы так, чтобы это было делать.

«GPT-5 обучен, чтобы быть хорошим для создания приложений с нулевым к индивидуальным приложениям, так и для разработки более полных приложений с полным стеком агентского в репо»,-ответил Сингал, неудивительно охватывая все варианты использования. Но он был немного более эффектным в следующей части своего ответа:

«Для разработчиков, создающих новый прототип, с нулевым выстрелом приложения, сквозного приложения, может быть быстрым способом проверки идей. Для разработчиков, которые либо работают над существующими приложениями, либо создание чего-либо для поддержания дольше, используя агентскую жгут и итерации над гранулированными функциями может быть более предпочтительным. Это действительно зависит».

«В конце концов, это выбор разработчика».
— Сингал

Поставщики интернет-поставщика обычно возвращают всю ответственность за пользователя-не вина Napster, некоторые из его пользователей загружают нелегальный контент, это не вина Facebook, некоторые из его пользователей имеют экстремальные политические взгляды и т. Д. Точно так же, Openai говорит разработчикам: эй, это ваш выбор, как вы используете GPT-5.

«В конце концов, это выбор разработчика,-сказал Сингал,-но устоявшиеся репозитовы имеют лучшую поддержку со стороны сообщества. Это помогает разработчикам в области обслуживания самообслуживания».

Что касается использования GPT-5 до сих пор, Сингал добавил, что «мы видели хорошее сочетание как кодировщиков Vibe / разработчиков приложений с нулевым до одного, а также, подключающие это к существующим гигантским приложениям для итерации».

Рамки оптимизированы для искусственного интеллекта

Один из более самоуверенных ответов Сингала был на перспективный вопрос, который я бросил для удовольствия.

Что вы думаете о возможности оптимизированных рамок для ИИ, спросил я? Например, более мелкие следов выполнения или AIPIS, удобные для искусственного интеллекта, компонентные API. Сингл казался заинтригованным.

«Это интересная идея! Соображения были бы связаны с обслуживаемостью и то, сколько присутствия« человека в петле »оптимально. Возможно, что то, что оптимально для ИИ не делает для интерпретируемого человеческого потребления. Это, в конечном итоге, это может стать гораздо более распространенным, поскольку ИИ для кодирования продолжает становиться частью основного рабочего процесса».

Итак, следите за A-оптимизированными фронтальными рамками в ближайшем будущем. В то же время, имейте в GPT-5, каким бы ни был лучше для вас, но будьте внимательны к качеству кода и обслуживаемости.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Ричард Макманус — старший редактор нового стека и пишет о тенденциях разработки веб -и приложений. Ранее он основал ReadWriteWeb в 2003 году и встроил его в один из самых влиятельных технологических новостей в мире. С самого раннего … Подробнее от Ричарда Макмануса

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *