Антропическая запускает новую модель искусственного интеллекта, которая «думает», пока вы хотите

Anpropic выпускает новую модель AI Frontier под названием Claude 3.7 Sonnet, которую компания разработала, чтобы «думать» о вопросах до тех пор, как этого захотят пользователи.

Антропический называет Claude 3.7 Sonnet первой в отрасли «модель гибридных рассуждений искусственного интеллекта», потому что это единственная модель, которая может дать как ответы в реальном времени, так и более рассматриваемые «продуманные» ответы на вопросы. Пользователи могут выбрать, активировать ли способности «рассуждения» модели искусственного интеллекта, которые подсказывают Sonnet Claude 3.7 «мыслить» в течение короткого или длительного периода времени.

Модель представляет собой более широкие усилия Anpropic по упрощению пользовательского опыта вокруг своих продуктов искусственного интеллекта. У большинства чат -ботов AI сегодня есть сложный сборщик модели, который заставляет пользователей выбирать из нескольких различных вариантов, которые варьируются по стоимости и возможностям. Лаборатории, такие как Антроп, предпочли бы, чтобы вам не придется думать об этом — в идеале, одна модель выполняет всю работу.

Claude 3.7 Sonnet в понедельник сообщает, что Anpropic сообщает, что только пользователи платят за планы Chatbot Claude Claude, но только пользователи платят за планы Chatbot Claude Antropic. Бесплатные пользователи Claude получат стандартную, не взволнованную версию Sonnet Claude 3.7, которая, как утверждает Антропические утверждения, превзойдет свою предыдущую модель по границе ИИ, Claude 3.5 Sonnet. (Да, компания пропустила номер.)

Claude 3,7 Сонет стоит 3 доллара за миллион токенов (то есть вы можете ввести примерно 750 000 слов, больше слов, чем вся серия «Властелин колец», в Клод за 3 доллара) и 15 долларов за миллион токенов. Это делает его дороже, чем O3-Mini OpenAI (1,10 долл. сша за 1 млн. Токены/4,40 долл. сша за 1 млн. Токены) и RO1 DeepSeek (0,55 долл. сша за 1 млн входных токенов/2,19 долл. сша за 1 млн. Токены), но имейте в виду, что O3-MINI и R1 долл. являются строго рассужденными моделями — не гибридами, такими как Claude 3.7 Sonnet.

Новые режимы мышления Антропика Изображение Кредиты: Антропический

Claude 3.7 Sonnet — это первая модель AI AIPIC, которая может «рассуждать», метод, который многие лаборатории искусственного интеллекта обратились к традиционным методам улучшения искусственного искусства.

Модели рассуждений, такие как O3-Mini, R1, Flash Google’s Gemini 2.0, и Xai’s Grok 3 (Think) используют больше времени и вычислительной мощности, прежде чем отвечать на вопросы. Модели разбивают проблемы на более мелкие шаги, что имеет тенденцию повысить точность окончательного ответа. Модели рассуждений не думают и не рассуждают, как человек, обязательно, но их процесс моделируется после вычета.

В конце концов, Антропик хотел бы, чтобы Клод выяснил, как долго он должен «думать» о вопросах самостоятельно, не нуждаясь в пользователях заранее выбирать элементы управления, в интервью Diane Penn в интервью Diane Penn в интервью Diane Penn в интервью Diane Penn сообщила TechCrunch.

«Подобно тому, как у людей нет двух отдельных мозгов для вопросов, на которые можно ответить немедленно, по сравнению с теми, которые требуют мысли», — написал Антропик в посте в блоге, поделившимся с TechCrunch, — мы считаем рассуждения просто одну из возможностей, которые должна пограничная модель быть плавно интегрированными с другими возможностями, а не чем -то, что должно быть предоставлено в отдельной модели ».

Антропик говорит, что позволит Claude 3.7 Sonnet показать свою фазу внутреннего планирования через «видимую подушку для царапины». Ли сказал, что пользователи TechCrunch увидят полный процесс мышления Клода для большинства подсказок, но некоторые части могут быть отредактированы в целях доверия и безопасности.

Процесс мышления Клода в приложении Claude (кредит: антроп)

Anpropic говорит, что оптимизировал режимы мышления Клода для реальных задач, таких как сложные проблемы кодирования или агентские задачи. Разработчики, поступившие с API Антрии, могут контролировать «бюджет» для мышления, скорости торгов и затрат на качество ответа.

На одном тесте для измерения задач по кодированию реального слова Swe-Bench, Claude 3,7 Sonnet был точным 62,3% по сравнению с моделью O3-Mini OpenAI, которая набрала 49,3%. На другом тесте, чтобы измерить способность модели AI взаимодействовать с моделируемыми пользователями и внешними API в розничной торговле, Tau-Bench, Claude 3.7 Sonnet набрал 81,2%по сравнению с моделью Operai, которая набрала 73,5%.

Антропик также говорит, что Claude 3.7 Sonnet откажется отвечать на вопросы реже, чем его предыдущие модели, утверждая, что модель способна провести более подробные различия между вредными и доброкачественными подсказками. Anpropic говорит, что снизил ненужные отказы на 45% по сравнению с Claude 3,5 сонета. Это происходит в то время, когда некоторые другие лаборатории искусственного интеллекта переосмысливают их подход к ограничению ответов их AI Chatbot.

В дополнение к Sonnet Claude 3.7, Anpropic также выпускает инструмент агентского кодирования под названием Claude Code. Запуск в качестве предварительного просмотра исследования, инструмент позволяет разработчикам выполнять конкретные задачи через Клода непосредственно из их терминала.

В демонстрации сотрудники антропного показали, как Claude Code может проанализировать проект кодирования с простой командой, такой как, «Объясните эту структуру проекта ». Используя простой английский в командной строке, разработчик может изменить кодовую базу. Claude Code будет описать свои изменения по мере внесения изменений, и даже тестирует проект на предмет ошибок или подтолкнуть его к репозиторию GitHub.

Claude Code изначально будет доступен для ограниченного числа пользователей на основе «первым приходом», сообщил TechCrunk, представитель антропного предложения.

Anpropic выпускает Sonnet Claude 3.7 в то время, когда лаборатории искусственного интеллекта отправляют новые модели искусственного интеллекта в головокружительном темпе. Антропик исторически принимал более методичный, ориентированный на безопасность подход. Но на этот раз компания хочет возглавить пакет.

Как долго длится вопрос. OpenAI может быть близок к выпуску собственной гибридной модели ИИ; Генеральный директор компании, Сэм Альтман, сказал, что она появится в «месяцах».