Модели Claud Sonnet и Opus крупные языковые модели Antropic давно стали фаворитами среди разработчиков, и сегодня компания запускает Claude Sonnet 4.5, последнюю версию своей основной модели, которую компания описывает как «лучшая модель кодирования в мире».
Компания также запускает обновления в Claude Code, агенте Claude SDK, который позволяет разработчикам создавать агентов с теми же инструментами, которые использует антроп, расширение кода VS и многое другое.
Существует также интригующий новый эксперимент «Представьте себе Claude», который использует новую модель для создания программного обеспечения на лету (но который будет доступен только для подписчиков Claude Max и только в течение следующих пяти дней).
Сонет 4.5
Сонет 4.5 будет более надежно следовать инструкциям и рефакторировать существующий код, говорит Антроп. На Swe-Bench подтвердился эталон, который проверяет, насколько хорошо модели удается работать над набором реальных запросов GitHub GitHub, сонет 4.5 баллов 77,2% (и 82% с параллельным вычислением времени испытания).
В нескольких областях, по словам Антриа, Sonnet 4.5 теперь превосходит Opus 4.1, флагманскую модель компании, включая работу над проблемами в индустрии финансовых услуг.
На Osworld, эталоне, который проверяет, насколько хорошо модели искусственного интеллекта выполняются в реальных задачах использования компьютера, Sonnet 4.5 теперь находится на вершине диаграмм с уровнем успеха 61,4%. Это большой скачок над сонетом 4, который ранее превысил список с успешным уровнем 43,9%, а также превзойдет Opus 4.1, который ранее набрал около 44%.
ИЗОБРАЖЕНИЕ КРЕДИТ: Антроп.
Для длительных, сложных задач Sonnet 4.5 теперь может работать автономно в течение 30 часов, по сравнению с семи часов для Opus 4. С этими обновлениями для модели Anpropic говорит, что Sonnet 4.5 теперь может сделать это, в то время как «поддержание фокусировки и производительности повсюду», хотя потребуется немного тестирования, чтобы увидеть, будет ли это верно в реальных сценариях.
Практически во всех контрольных показателях кодирования сонет 4.1 бьет конкурентов, таких как GPT-5 Openai и Google Gemini 2.5 Pro. Однако в оригинальных критериях, где модели Anpropic, как правило, боролись немного больше, конкуренция остается впереди.
ИЗОБРАЖЕНИЕ КРЕДИТ: Антроп.
Но, возможно, что еще более важно, так это то, что Anpropic дал модели доступ к ряду новых функций — аналогично тому, к чему имеет доступ его агент кода Claude Code. К ним относятся доступ к виртуальным машинам и памяти, а также лучшее управление контекстом и многоагентная поддержка.
Что касается того, что Anpropic говорит, что Sonnet 4.5 — это первая модель, которую она выпустила, которая способна восстановить веб -приложение Claude.AI, которое заняло около пяти с половиной часов и включало более 3000 применений инструментов.
«Мы видим современные результаты кодирования от Claude Sonnet 4.5, со значительными улучшениями в более длительных задачах горизонта»,-сказал генеральный директор курсора Майкл Труэлл. «Это подтверждает, почему многие разработчики, использующие курсор, выбирают Клода для решения своих самых сложных проблем».
Цены на сонет 4.5 останутся на уровне 3 долл. сша за миллион токенов входов/вывода, так же, как антроп, ранее взимаемый для Sonnet 4.
ИЗОБРАЖЕНИЕ КРЕДИТ: Антроп.
Что нового в Claude Code?
Говоря о Claude Code, агент по кодированию Anpropic теперь, конечно, также получит доступ к этой новой модели, но компания также также запускает еще несколько новых функций. Claude Code, который, к примеру, получает более 500 миллионов долларов сша в виде доходов от скорости RUN-RATE, при этом использование увеличивается более чем на 10 раз за последние три месяца, например, получает нативное расширение кода Visual Studio. Это позволит разработчикам увидеть изменения Claude Code в режиме реального времени с встроенными Diffs.
Claude Code в терминале также получает некоторые обновления, с улучшенной видимостью статуса и историей подсказки для поиска. Последний здесь особенно полезен, учитывая, что вы часто захотите повторно использовать подсказки. Ранее вам приходилось либо найти эти подсказки в терминале, скопировать и вставить их, либо сохранить их за пределами терминала.
Также новыми являются контрольные точки, которые облегчают откат вашего кода, когда Claude Code выходит из строя. Ранее разработчики должны были делать это вручную, втянув код в свой репозиторий или (задыхаться!), Сделав локальные резервные копии.
Клод Агент SDK
Для тех разработчиков, которые хотят создавать агентов на основе той же основы, что и Claude Code, Anpropic запускает агента Claude SDK. Новая SDK использует ту же инфраструктуру, которая поддерживает Claude Code, говорит Антроп, но позволяет им создавать любого агента, которого они хотят. SDK будет иметь агент оркестровки, управление памятью и контекстом, использование инструментов, управление разрешениями и многое другое.
ИЗОБРАЖЕНИЕ КРЕДИТ: Антроп.
Что касается API, разработчики получают инструмент памяти, чтобы помочь своим агентам поддерживать контекст в течение длительных задач. Anpropic также добавляет функцию автоматического управления контекстом, которая увидит, что Claude редактирует окно контекста и удаляет устаревшие данные по мере необходимости.
Строительство программного обеспечения на лету: представьте себе с Клодом
«Представьте себе, что с Клодом» — это эксперимент «Антропик» в том, как будет выглядеть для создания программного обеспечения и пользовательских интерфейсов на лету.
«Никакая функциональность не является предопределенной; ни один код не является предварительным. То, что вы видите, это создает Клод в режиме реального времени, отвечает и адаптируется к вашим запросам во время взаимодействия», — объясняет Антропик в сегодняшнем пресс -релизе. «Это забавная демонстрация, показывающая, что может сделать Claude Sonnet 4.5 — способ увидеть, что возможно, когда вы объединяете способную модель с правильной инфраструктурой».
То, что именно происходит на заднем плане здесь, в то время как Клод строит эти приложения, еще не совсем ясно. Anpropic еще не предоставила никаких дополнительных подробностей.
В последние месяцы многие эксперты по ИИ говорили об этой идее. Что если бы вы могли просто использовать ИИ для создания необходимого вам программного обеспечения, когда вам это нужно? Такие инструменты, как Lovable, уже попадают туда в некоторой степени, но это все еще не совсем бесшовный опыт создания того, что по сути является одноразовым программным обеспечением, которое здесь антропическое обещает.
Очевидно, что в настоящее время это всего лишь эксперимент, чтобы продемонстрировать возможности Sonnet 4.5-и доступен только пользователям на плане Claud Max от Antropic на следующие пять дней-но она показывает, куда отрасль может направиться в не столь устойчивое будущее.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Прежде чем присоединиться к новому стеку в качестве старшего редактора для ИИ, Фредерик был редактором предприятия в TechCrunch, где он освещал все, от роста облака и самых ранних дней Kubernetes до появления квантовых вычислений …. Подробнее от Frederic Lardinois