Антропический использовал покемона для сравнения своей новейшей модели искусственного интеллекта

Антропик использовал покемона для сравнения своей новейшей модели ИИ. Да, правда.

В сообщении в блоге, опубликованном в понедельник, Anpropic сказал, что он проверил свою последнюю модель Claude 3.7 Sonnet, на Game Boy Classic Pokémon Red. Компания оснастила модель базовой памятью, вводом пикселей экрана и вызовами функций, чтобы нажать кнопки и перемещаться по экрану, что позволило ей непрерывно воспроизводить покемонов.

Уникальной особенностью Claude 3.7 Sonnet является его способность участвовать в «расширенном мышлении». Подобно O3-Mini и R1 Deepseek R1, Claude 3.7 Sonnet может «рассуждать» через сложные проблемы, применяя больше вычислений-и занимая больше времени.

По -видимому, это пригодилось в Pokémon Red.

По сравнению с предыдущей версией Claude, Claude 3.0 Sonnet, который не смог покинуть дом в Палле -Таун, где начинается история, Claude 3.7 Сонет успешно сражался с тремя лидерами спортзал покемонов и выиграл свои значки.

Кредиты изображения:Антроп

Теперь неясно, сколько вычислителей потребовалось для Claude 3.7 Sonnet, чтобы достичь этих вех — и сколько времени каждый занял. Антропик только сказал, что модель выполнила 35 000 действий, чтобы охватить последнего лидера спортзала, Surge.

Конечно, не будет много времени, прежде чем какой -то предприимчивый разработчик узнает.

Pokémon Red — это скорее игрушечный эталон, чем все. Тем не менее, существует долгая история игр, используемых в целях сравнения ИИ. Только за последние несколько месяцев несколько новых приложений и платформ появились на тестировании игровых способностей моделей на названиях, начиная от уличного истребителя до Pictionary.

Разработка сайтов в Гомеле

Похожие записи

Spark, Mayfield и Kleiner Perkins выливают еще 75 млн. Долл. США в AI Center Retym Retym

Федералы обвиняют Uber в том, что он взимает с клиентов за подписки без согласия

Sipay Турции собирает 78 миллионов долларов, чтобы расширить свои полосоподобные услуги на развивающиеся рынки

Spotify говорит, что это исправление ошибки, которая заставила пользователей премиум -класса услышать рекламу

Исследование MIT обнаруживает, что AI, на самом деле, не имеет ценностей

Платежи по вымогателям упали в 2024 году, когда жертвы отказались платить хакеров

Модный стартап, кажется, в беде

У Конгресса есть вопросы о банкротстве 23 и

Исследователи называют несколько стран потенциальных клиентов Paragon Spyware

Revel открывает первый эва-центр быстрого зарядки в Сан-Франциско

NVIDIA GTC 2025: чего ожидать от шоу этого года

Исследователи говорят, что они обнаружили новый метод «масштабирования» ИИ, но есть причина скептически

Вам тоже может быть интересно:

Новый инструмент на основе ржавчины устанавливает Ruby за секунды

Что нужно разработчикам для создания успешных приложений ИИ

Меллеа от IBM устраняет скрытую слабость искусственного интеллекта с открытым исходным кодом

Помимо ажиотажа: 4 способа использования ИИ для защиты от кибербезопасности

OpenTofu присоединяется к CNCF: новый дом для проекта IAC с открытым исходным кодом

Почему ваша карьера в области разработки платформ на самом деле является работой по продажам

Скорость плюс безопасность: прекращение конфликта между разработчиками и инженерами платформ

Год утилиты ИИ: переход от ранних побед к долгосрочной стоимости

Ваш конвейер CI/CD не готов к отправке агентов ИИ

Обзоры кода IA Coderabbit теперь живут бесплатно в коде VS, курсор

Kubernetes на периферии: уроки периферийной стратегии GE HealthCare

Обзор разработчика Warp для Windows, приложения для терминала AI