Сегодня Google выпустила Gemini 3 Pro, последнюю версию своего семейства базовых моделей, а за ней последуют и другие варианты Gemini 3. Gemini 3 уже доступен во многих продуктах Google, включая Google Search, приложение Gemini, AI Studio, Vertex AI и различные инструменты разработки агентов Google, включая недавно выпущенный Antigravity.
Рекордные показатели
Неудивительно, что Google называет Gemini 3 Pro своей самой умной моделью. По данным Google, модель возглавит таблицу лидеров LMArena с результатом 1501 балл. Он также набирает 37,5% по последнему экзамену человечества и 91,9% по GPQA Diamond, эталону, который задает научные вопросы на уровне доктора философии и которому ранее OpenAI GPT-5.1 лидировал с точностью 87,6%.
Одна из областей, которую подчеркивает команда Google, — это способность Gemini 3 Pro хорошо справляться с задачами мультимодального рассуждения, при этом модель также достигает рекордных результатов по многим из этих тестов. Это также означает, что он преуспеет в задачах визуального мышления, и еще одна область, которую выделил Google, — это его способность создавать сложные анимации и симуляции на лету.
Сравнение Gemini 2.5 Pro и 3 на задаче визуализации. (Фото: Google)
Конечно, тесты — это еще не все, и иногда они могут даже немного вводить в заблуждение, но Google утверждает, что новая модель может привнести «новый уровень глубины и нюансов в каждое взаимодействие», не прибегая к клише и подхалимскому поведению, часто наблюдаемому в других моделях. Однако различия между семействами моделей действительно становятся очевидными только в повседневном использовании, поэтому разработчикам и потребителям потребуется несколько дней, чтобы почувствовать, насколько хорошо модель работает в реальных задачах.
Программирование с помощью Gemini 3
Что касается кодирования, Google заявляет, что новая модель также превосходит Gemini 2.5 Pro при кодировании как в агентных рабочих процессах, так и при выполнении задач с нулевым результатом. Он будет доступен в собственных инструментах Google, таких как Gemini CLI и режим агента Android Studio, а также в сторонних инструментах, таких как Cursor, GitHub, JetBrains, Manus и Cline и других.
«Cline использует Gemini 3 для автономной генерации кода в IDE разработчиков», — сказал Ник Паш, руководитель отдела искусственного интеллекта Cline. «Gemini 3 Pro решает сложные, долгосрочные задачи по всей базе кода, поддерживая контекст посредством многофайлового рефакторинга, сеансов отладки и реализации функций. Он использует длинный контекст гораздо эффективнее, чем Gemini 2.5 Pro, и решает проблемы, которые ставят в тупик другие ведущие модели».
Доступ к API будет стоить 2 доллара сша за миллион входных токенов и 12 долларов сша за миллион выходных токенов для приглашений с 200 000 токенов или меньше. Это больше, чем 1,25 и 10 долларов за миллион токенов ввода/вывода Gemini 2.5 Pro.
С этим запуском Google также выпускает клиентский инструмент bash, который позволит модели использовать команды оболочки во время агентных рабочих процессов, чтобы она могла, например, перемещаться по файловой системе. Также будет размещенный инструмент bash для генерации кода и прототипирования, но на данный момент размещенный инструмент будет доступен только в API Gemini для партнеров с ранним доступом.
Глубокое размышление скоро появится
Вскоре Google также запустит еще один вариант Gemini 3: Gemini 3 Deep Think. В этой версии будет улучшена модель рассуждений, которая, вероятно, еще больше повысит производительность модели. На данный момент Google делает эту модель доступной только для тестировщиков безопасности, но вскоре она станет доступна и подписчикам Google AI Ultra (которые платят 250 долларов в месяц).
«Gemini 3 Deep Think превосходит и без того впечатляющую производительность Gemini 3 Pro в таких тестах… как Humanity’s Last Exam и GPQA Diamond. Таким образом, он действительно расширяет границы интеллекта, помогая вам решать самые сложные проблемы», — пояснил Тулси Доши, старший директор Google и руководитель отдела продуктов для моделей Gemini, на брифинге для прессы перед сегодняшним запуском.
ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Прежде чем присоединиться к The New Stack в качестве старшего редактора по искусственному интеллекту, Фредерик был корпоративным редактором в TechCrunch, где освещал все, от появления облака и первых дней Kubernetes до появления квантовых вычислений…. Подробнее от Фредерика Лардинуа