Помимо галлюцинаций, клиенты в прошлом жаловались на то, что Близнецы Google были медленными, особенно с более крупными контекстами и количеством токенов.
Чтобы решить эту проблему, компания объявила, что создает некоторые из самых быстрых компьютеров на сегодняшний день с новым чипом ИИ под названием Ironwood, TPU седьмого поколения, который был объявлен в Google Cloud Next.
Каждый сервер, называемый «Pod» от Google, будет взаимосвязан 9 216 чипов железного дерева, которые могут совместно работать как один мегапет. Один стручок может обеспечить 42,5 экзафлопа производительности искусственного интеллекта.
«Суперкомпьютер номер один в мире, El Capitan, поддерживает 1,7 exaflops на Pod. Ironwood предлагает более 24 раз, чем вычисляет мощность», — сказала Амин Вахдат, вице -президент и генеральный директор по машинному обучению, системам и облачному ИИ в Google.
Каждый из 9 216 чипов Железного дерева обеспечивает 4614 терафлопов производительности FP8 и связана с проприетарной технологией Google.
Взаимосвязанные чипы находятся в жидком возрасте и «охватывают почти 10 мегаватт»,-сказал Google в пресс-релизе.
Это много энергии, но это единственный способ, которым Google может заблокировать солидную производительность искусственного интеллекта.
Google нуждается в Ironwood
Google организует цифровую информацию мира и представляет ее пользователям, сначала через поиск, а теперь через AI.
Чип Ironwood определит, насколько быстро Google предоставляет информацию через Gemini.
Спрос на ИИ — это ошеломляющие центры обработки данных, а более быстрые чипы, такие как Ironwood, удовлетворяют спрос. Ironwood — это седьмая версия линии чипов AI, выпущенной Google, начиная с 2015 года.
«Как индустрия, за последние восемь лет мы наблюдали 10-кратное увеличение спроса на обучение и обслуживание моделей обучения и обслуживания. Это фактор в 100 миллионов»,-сказал Вахдат.
Чип предназначен для работы на рабочих нагрузках Gemini, которая работает в инфраструктуре Google Cloud. Это не будет доступно с полки.
Ironwood более быстрее и более эффективно, чем TPU шестого поколения под названием Trillium, который был выпущен в прошлом году.
«TPU Ironwood в два раза более энергоэффективно, чем наш TPU шестого поколения, Trillium»,-сказал Вахдат.
Каждый TPU Ironwood имеет 192 ГБ памяти HBM, которая в шесть раз больше, чем память HBM HBM 32 ГБ (с высокой пропускной способностью) на Trillium.
Емкость HBM на чипе важнее скорости чипа AI. Более высокая память помогает чипам сохранять и обрабатывать более высокие куски, необходимые для более быстрой обработки ИИ.
Соревнование
Ironwood Google приходит в нужное время. Другие запатентованные модели ИИ работают на конкурентных чипах.
В прошлом месяце NVIDIA объявила о своих последних графических процессорах Blackwell Ultra Chip и следующего поколения Rubin и Feynman. Эти чипсы Power Open Lose Models AI.
В этом году Amazon отправит свой чип Trainium3 AI. Модель Claude’s Antropic оптимизирована для чипа Trainium2.
В настоящее время Microsoft использует NVIDIA GPU, но развернула свой собственный акселератор ИИ под названием MAIA для вывода рабочих нагрузок.
Построен для вывода
По словам Вахдата, Ironwood, который Google также называл TPU7, является первым TPU для рассуждений и силового мышления.
В первые годы чипы ИИ были построены для обучения. Но AI теперь все о выводе, с более умными моделями, такими как Openai O1 и DeepSeek R1, которые могут рассуждать и думать, прежде чем предоставлять ответы.
«Речь идет не о данных, помещенных в модель, а то, что модель может сделать с данными после того, как она была обучена», — сказал Вахдат.
Генеральный директор Nvidia Jensen Huang в прошлом месяце заявил, что модели рассуждений будут способствовать вычислению спроса более чем в 100 раз по сравнению с моделями, не связанными с Reessing.
TPU Ironwood разработан только для подачи Близнецов, который находится в версии 2.5. GPU NVIDIA более общие и могут запускать практически любую модель, кроме Близнецов.
«Запуск TPU основывается на приверженности предоставлению опциональности аппаратного обеспечения искусственного интеллекта для наших клиентов, включая наши обширные предложения Nvidia на основе графических процессоров»,-сказал Вахдат.
Спрос на более быстрые чипсы ошеломляет таких, как Google, Openai и Microsoft. В результате, производители графических процессоров Nvidia и AMD также представляют новый чип ИИ каждый год. Чипсы ранее были выпущены каждые полтора до двух лет.
Доступность
Ironwood TPU будет доступен в двух конфигурациях, TPU7 и TPU7X. Эти технические названия будут отображаться для клиентов Google в консоли, документации и выставления счетов, сообщила пресс -секретарь Google в новом стеке.
Google не объявил о конкретной дате доступности для Ironwood в Google Cloud.
Но можно с уверенностью предположить, что TPU Ironwood будет самым дорогим, и более старые TPU, такие как Trillium (TPU6) или TPU V5 -предложения, упадут в цену. Клиенты могут выбрать эти чипы для своих рабочих нагрузок искусственного интеллекта.
«Некоторым может потребоваться расширенные возможности вывода Ironwood, в то время как другие могут предпочесть экономически эффективную подготовку TPU V5E»,-сказала пресс-секретарь Google.
Типы данных
Числа Peak Performance, отраженные выше, предназначены для типа данных FP8, который является предпочтительным типом данных для вывода.
«Ironwood также поддерживает FP4, чтобы клиенты могли получить дополнительное повышение в движении данных и эффективности энергоэффективности при более низкой точке», — сказала пресс -секретарь.
Сенчики NVIDIA по своему графическому процессору, поделившемуся в GTC в прошлом месяце, находился на типе данных FP4. Типы данных с более низким спецификацией, такие как FP4, обычно производят менее точные ответы, чем FP8, но значительно более эффективны.
Ironwood также поддерживает учебные рабочие нагрузки, которые требуют высоких типов данных.
Обучающие рабочие нагрузки «получают выгоду от массовой параллельной обработки и эффективного доступа к памяти, который позволяет Ironwood», сказала пресс -секретарь Google.
Стек Google
Глобальная инфраструктура центра обработки данных Google разделена на «гиперкомпьютеры ИИ», в которых содержатся чипы ИИ, хранилище, сеть и память.
Ironwood дает гиперкомпьютеру ИИ намного больше мышц.
Разработчики могут войти в гиперкомпьютер и определить тип необходимого им чипа, такого как GPU, TPU или CPU. Выбор зависит от проблемы.
Слои программного обеспечения HyperComputer включают Vertex AI, в котором размещаются Близнецы, ламу, Джемму и другие модели ИИ.
Разработчики могут выбрать структуру ИИ и справочные реализации, такие как JAX или Pytorch, и программное обеспечение для оркестровки, такое как GKE или Slurm.
Новый слой, объявленный в Google Cloud Next, помещает агентов AI как способ вовлечения или ответа на запросы. Gemini 2.5 — модель рассуждения.
Google гарантирует доступность и доставку услуг искусственного интеллекта в Google Cloud через контракты на уровне услуг.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Агам Шах освещал его более десяти лет. Помимо машинного обучения, оборудования и чипов, он также интересуется боевыми искусствами и Россией. Подробнее от Агама Шаха