Anpropic запускает свои самые мощные модели для кодирования еще

САН -ФРАНЦИСКО. На своей первой конференции разработчиков Код с Claude, AI Company Anthropic Today сегодня выпустила последние версии своих крупных языковых моделей (LLMS): Claude Opus 4 и Claude Sonnet 4.

Эти обновления обещают значительные достижения для разработчиков и инженерных команд, особенно в области кодирования и рассуждений с длинным контекстом. Во всех критериях, связанных с кодированием, обе модели легко превосходят свои предшественники, хотя в некоторых других областях, таких как визуальные рассуждения, модель старого сонета фактически превзошла новый.

В то время как Sonnet 3.7 уже предложил гибридный подход, и с быстрым ответом и расширенным режимом мышления для более глубоких рассуждений, Opus 4 ранее не имел этой регулируемых возможностей. Это обновление приносит ту же функциональность двойного режима в Opus 4.

Генеральный директор Антрии Дарио Амодеей в Кодексе компании с Claude Conference. Кредит изображения: новый стек.

Эти новые модели немедленно доступны, на таких платформах, как собственный API API Ampropic, Amazon Bedrock и Google Vertex AI. Claude Sonnet 4 доступен бесплатно на claude.AI, а Opus 4 доступен для оплаты пользователей.

«Claude 4 отмечает новую эру в сотрудничестве с ИИ», — говорит компания. Мы создаем Клода, чтобы быть вашим надежным партнером — работая с полным контекстом, поддерживая внимание на более длинных проектах и ​​оказывающую трансформационное воздействие на каждом шаге ».

ИЗОБРАЖЕНИЕ КРЕДИТ: Антроп.

Опус 4

Opus — это название для флагманских моделей Anpropic. Когда Opus 3 запустился чуть более года назад, он закрепил репутацию Anpropic как предложение некоторых из лучших моделей для кодирования вариантов использования. Компания описывает Opus 4 как самую мощную модель и «лучшую модель кодирования в мире». Компания заявляет, что она также отличается в продуктах для решения проблем и питания.

Между тем, GitHub, который использует Claude в качестве основы для своего нового агента по разработке программного обеспечения (SWE), говорит, что он достиг на 9% лучших результатов, используя 30% меньше жетонов с Opus 4.

Клод играет покемонов. ИЗОБРАЖЕНИЕ КРЕДИТ: Антроп.

Частично, что выделяет Opus 4, так это то, что он может выполнять длительные задачи и сохранять свой контекст по всему тому, что Антропик описывает как «тысячи шагов». Некоторые из тестеров модели уже смогли использовать эту новую возможность.

«Opus 4 предлагает действительно продвинутые рассуждения для кодирования», — сказал Юсуке Каджи, генеральный директор AI, Rakuten. «Когда наша команда развернула Opus 4 в сложном проекте с открытым исходным кодом, она автономно закодировала в течение почти семи часов — огромный скачок в возможностях искусственного интеллекта, который оставил команду пораженной».

Anpropic сохранила цену для использования Opus 4 такую ​​же, как и для его предшественника, причем использование API достигает 15 долларов сша за миллион токенов вклада и 75 долларов сша за миллион жетонов производства из модели.

ИЗОБРАЖЕНИЕ КРЕДИТ: Антроп.

Сонет 4

Как и большинство других компаний LLM, в том числе OpenAI и Google, Anpropic предлагает различные модели по разным ценам. Хотя Opus более мощный, чем сонет, он также дороже и, как правило, медленнее отвечать. Напротив, модели сонета предназначены для обеспечения баланса между высокой производительностью и экономической эффективностью, что делает их более доступным вариантом для многих пользователей. (Хайку, который сегодня не получает обновление, является самой быстрой и наименее дорогой моделью компании, но также и наименее умной.)

Для Sonnet 4 Anpropic говорит, что эта новая версия улучшается после Sonnet 3.7, которая давно возглавила эталон SWE-Bench для оценки моделей по задачам разработки программного обеспечения. В настоящее время он набирает 72,7% по сравнению с 62,3% для предыдущей версии.

«Модель уравновешивает производительность с практичностью как для внутренних, так и для внешних вариантов использования, одновременно предлагая повышенную управляемость, которая дает вам больший контроль над тем, как она реализует изменения», — утверждает Антропическая.

На мероприятии по запуску компании в Сан -Франциско сегодня генеральный директор Antropric Dario Amodei также отметил, что Sonnet 4 не так уж также, как его предшественник, общая жалоба среди разработчиков, которые использовали предыдущую версию и часто видели ее как разочарование по сравнению с Sonnet 3.5.

Однако не только сами модели улучшились. Он также добавил несколько новых возможностей в то, как пользователи смогут работать с этими моделями. Как Opus 4, так и Sonnet 4 теперь могут использовать инструменты, включая веб -поиск, одновременно продумывая проблему. Возможно, здесь самое интересное, что они могут переключаться между использованием инструмента и рассуждениями, пытаясь улучшить свои ответы. Они могут даже использовать несколько инструментов параллельно.

Кроме того, при разрешении модели теперь могут получить доступ к локальным файлам. Это позволяет им «продемонстрировать значительно улучшенные возможности памяти, извлекать и сохранение ключевых фактов для поддержания непрерывности и создания неприятных знаний с течением времени», Антропические государства.

Антропический также сохранил цену для сонета 4 устойчивой. Он остается на уровне 3 долл. сша/15 долл. сша (вход/вывод) на миллион токенов.

Клод Код

В дополнение к новым моделям, Anpropic также делает Claude Code, его агент -инструмент кодирования, обычно доступным сегодня. Claude Code может жить в терминале и, теперь, в IDE разработчика. Anpropic делает расширения доступными для VS -кода и Jetbrains. Это ставит его непосредственно в конкуренцию с такими инструментами, как Github Copilot, а также курсором и виндсурфом (которые, чтобы сделать это более интересным, делает модели Anthropic, доступными для разработчиков в своих инструментах).

Anpropic также выпускает новый SDK Claude SDK, так что разработчики могут создавать свои собственные агенты и приложения с агентом Claude Code в своем ядре.

Пример кода для SDK довольно интересный: это Claude Code на GitHub. При этом разработчики теперь могут пометить Claude по запросам, чтобы «ответить на отзыв рецензента, исправить ошибки CI или изменить код». Антропический и Github уже давно были близкими партнерами.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Прежде чем присоединиться к новому стеку в качестве старшего редактора для ИИ, Фредерик был редактором предприятия в TechCrunch, где он освещал все, от роста облака и самых ранних дней Kubernetes до появления квантовых вычислений …. Подробнее от Frederic Lardinois

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *