Антропический использовал покемона для сравнения своей новейшей модели искусственного интеллекта

Антропик использовал покемона для сравнения своей новейшей модели ИИ. Да, правда.

В сообщении в блоге, опубликованном в понедельник, Anpropic сказал, что он проверил свою последнюю модель Claude 3.7 Sonnet, на Game Boy Classic Pokémon Red. Компания оснастила модель базовой памятью, вводом пикселей экрана и вызовами функций, чтобы нажать кнопки и перемещаться по экрану, что позволило ей непрерывно воспроизводить покемонов.

Уникальной особенностью Claude 3.7 Sonnet является его способность участвовать в «расширенном мышлении». Подобно O3-Mini и R1 Deepseek R1, Claude 3.7 Sonnet может «рассуждать» через сложные проблемы, применяя больше вычислений-и занимая больше времени.

По -видимому, это пригодилось в Pokémon Red.

По сравнению с предыдущей версией Claude, Claude 3.0 Sonnet, который не смог покинуть дом в Палле -Таун, где начинается история, Claude 3.7 Сонет успешно сражался с тремя лидерами спортзал покемонов и выиграл свои значки.

Кредиты изображения:Антроп

Теперь неясно, сколько вычислителей потребовалось для Claude 3.7 Sonnet, чтобы достичь этих вех — и сколько времени каждый занял. Антропик только сказал, что модель выполнила 35 000 действий, чтобы охватить последнего лидера спортзала, Surge.

Конечно, не будет много времени, прежде чем какой -то предприимчивый разработчик узнает.

Pokémon Red — это скорее игрушечный эталон, чем все. Тем не менее, существует долгая история игр, используемых в целях сравнения ИИ. Только за последние несколько месяцев несколько новых приложений и платформ появились на тестировании игровых способностей моделей на названиях, начиная от уличного истребителя до Pictionary.