Google на этой неделе развернула обновленную модель Gemini 2.5 Pro с тем, что она описывает как «значительно расширенные возможности кодирования» для разработчиков. Гигант поиска и веб -сервисов включил ранний доступ к предварительному просмотру Gemini 2.5 Pro (I/O Edition) в преддверии запланированного дебюта 20 мая в Google I/O.
Основываясь на обратной связи, полученной от разработчиков во время тестирования, эта новая модель якобы имеет более глубокое понимание кода в сочетании с высококлассными возможностями рассуждений. Google утверждает, что эта комбинация обеспечивает путь к более интуитивно понятным рабочим процессам разработки, упрощая процесс строительства.
По словам Google, достижения в области архитектуры и обучения Gemini 2.5 Pro привели к более сложной способности понимать, разум и генерировать код, что делает его более способным и надежным ИИ для задач разработки программного обеспечения. Это было зарегистрировано как в контрольных результатах, так и в неподтвержденных доказательствах от разработчиков, сообщила компания.
Эта модель превосходит в разработке фронт-энд и пользовательского интерфейса, и это не является постепенной настройкой, сказал Google. Обновленная модель в настоящее время возглавляет таблицу лидеров WebDevarena, демонстрируя превосходную способность в кодировании. Он также продолжает опираться на свою основу в местной мультимодальности и длинном контексте; Он обладает самым современным выступлением в понимании видео, со счетом 84,8% на эталоне Videomme.
Почему рассуждения искусственного интеллекта настолько улучшены
Основное улучшение в этой новой версии заключается в том, что инженеры Google улучшили рассуждения искусственного интеллекта для кодирования. Это можно объяснить этими факторами:
- Gemini 2.5 Pro описывается как «модель мышления» с возможностями рассуждений, встроенных непосредственно в ее архитектуру, а не является функцией болта. Это позволяет модели анализировать информацию, делать логические выводы, включать контекст и принимать более обоснованные решения при создании кода. Это улучшенное рассуждение приводит к лучшему решению проблем и более точной генерации кода.
- Сообщается, что новая версия обобщается лучше до проблем, с которой она не сталкивалась ранее. Это предполагает улучшенную способность применять свое понимание принципов кодирования к новым ситуациям, что приводит к более адаптируемому коду.
Благодаря контекстному окну токена (и планам на 2 миллиона), Gemini 2.5 Pro может обрабатывать и разум по сравнению с гораздо более крупными кодовыми базами и более обширной контекстной информацией. Это позволяет ему лучше понять общий проект и генерировать более когерентный и контекстуально подходящий код, особенно в сложных проектах с многочисленными файлами и зависимостями.
Модель демонстрирует более глубокое понимание кода, позволяя ему делать более качественные вызовы и выбирать соответствующие абстракции, аналогичные более старшим разработчикам. Это улучшенное понимание нюансов кода позволяет создавать более сложные и контекстуально релевантные предложения кода и генерацию.
Способность Gemini 2.5 Pro понимать и обрабатывать информацию в разных методах (текст, аудио, изображения, видео) может способствовать улучшению рассуждений по кодированию в определенных сценариях, таких как генерация кода из видео демонстрации или понимание дизайна пользовательского интерфейса с визуальных вводов.
Другими конкретными упомянутыми тестировщиками улучшения является значительное снижение ошибок, связанных с вызовом функций и улучшенными частоты триггеров. Это указывает на лучшее понимание того, как взаимодействовать с внешними инструментами и API, что приводит к более надежной и функциональной интеграции кода.
Модель использует внутренний «процесс мышления» во время генерации ответов, который включает в себя многоэтапное планирование для решения сложных задач. Разбивая проблемы и рассуждения с помощью потенциальных решений, можно получить более эффективные и точные результаты кодирования.
Это доступно сегодня, сказал Google. Улучшенная модель будет плавно заменить текущий Gemini 2.5 Pro в API Gemini в Google AI Studio и Vertex AI и приложении Gemini, что делает эти расширенные возможности кодирования, немедленно доступными для разработчиков.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Крис Дж. Preimesberger, писатель/редактор, работающий в нескольких публикациях с июня 2021 года, является бывшим редактором Eweek. Он отвечал за освещение публикации в течение десятилетия (2011-2021). За его 16 лет и более 5000 статей в … Подробнее от Криса Дж. Preimesberger