AWS обновляет свои модели Nova, чтобы конкурировать с Google, Anthropic и OpenAI

ЛАС-ВЕГАС — Сегодня на конференции re:Invent в Лас-Вегасе компания AWS представила последнее поколение моделей фундаментов Nova. Nova 2 Lite, Pro и Sonic, а также новая модель Omni, которая является новой для семейства и может принимать текст, аудио, изображения и видео в качестве входных данных и выводить текст и изображения.

AWS анонсировала первый набор моделей Nova на прошлогодней выставке re:Invent и со временем выпустила ряд дополнительных моделей для генерации изображений, видео и других вариантов использования. Однако по большей части эти модели так и не завоевали такого же внимания, как модели других производителей, и к настоящему времени эти оригинальные модели значительно отстают от самых современных моделей из передовых лабораторий, таких как Anthropic, OpenAI и Google, а также от многих моделей с открытым весом.

Однако с этим новым выпуском AWS догоняет его, и компания не боится ссылаться на тесты, которые сравнивают эти модели с текущими передовыми моделями (многие из которых были запущены только в последние несколько недель).

Что касается цен, новые модели будут иметь конкурентоспособную цену в размере 0,3/2,5 доллара сша за миллион токенов ввода/вывода для модели Lite. За модели Pro и Omni AWS взимает разные цены в зависимости от формата. Для модели Pro они начинаются с 1,25/10 долларов сша за миллион токенов ввода/вывода для текстовой модели.

Семейство моделей AWS Nova 2 (Фото: AWS).

Нова 1 Лайт

Например, версия Lite, которая, по утверждению AWS, идеально подходит для использования в сценариях обслуживания клиентов, обработки документов и автоматизации рабочих процессов, является конкурентоспособной и иногда превосходит по производительности такие модели, как Claude Haiku 4.5 от Anthropic и GPT-5-mini от OpenAI (и Gemini Flash 2.5 от Google, но на данный момент это более старая модель).

Основная философия этой модели, как и в семействе Haiku от Anthropic, заключается в поиске правильного компромисса между скоростью и стоимостью.

Тесты Nova 2 Lite (фото: AWS).

Модель Nova 2 Lite также поддерживает новый сервис AWS Nova Act, новый сервис для управления агентами, использующими браузер. AWS утверждает, что Nova Act обеспечивает 90% надежности протестированных ею рабочих процессов клиентов.

Нова 2 Про

Nova Pro — это самая интеллектуальная модель рассуждения AWS, утверждает компания, которая превосходно справляется с задачами, требующими точности, анализа нескольких документов, рассуждений над изображениями и видео, а также задач кодирования. Тесты ставят его в один ряд с Claude Sonnet 4.5 и GPT-5- и GPT-5.1, а также с предварительной версией Gemini 3 от Google (поскольку Gemini 3 был запущен только на прошлой неделе, AWS еще не предоставила тесты для окончательной версии Gemini 3).

Было бы неплохо увидеть сравнение с Opus 4.5 от Anthropic, поскольку он превзошел Gemini 3 Pro во многих тестах, но стоит отметить, что Nova 2 Pro превзошел или сравнялся с Gemini 3 Pro только в 8 из 18 тестов.

Как отмечает AWS, October 2 Pro также можно использовать в качестве модели преподавателя для дистилляции знаний.

Тесты Nova 2 Pro (Фото: AWS).

Нова 2 Соник

Соник — это своего рода специализированная модель. Это модель преобразования речи в речь, которая, вероятно, лучше всего подходит для решений контакт-центров, таких как собственный сервис Amazon Connect, и других вариантов использования помощников с искусственным интеллектом.

Он предназначен для создания человеческих разговоров в реальном времени на нескольких языках с выразительными голосами. Он может переключаться между голосом и текстом по мере необходимости, а его окно токенов составляет один миллион токенов, что позволяет ему сохранять контекст в долгих разговорах.

Нова 2 Омни

Omni — новое пополнение в семействе Nova. AWS описывает ее как «первую унифицированную мультимодальную модель мышления». Он может обрабатывать текст, изображения, видео и аудио в качестве входных данных и создавать как текстовые, так и графические выходные данные.

AWS утверждает, что модель может обрабатывать эквивалент 750 000 слов контекста (по какой-то причине в материалах AWS не указано количество токенов, которое может обрабатывать модель).

«Хотя в отрасли нет моделей, сопоставимых с Nova 2 Omni, она демонстрирует сильные стороны в общедоступных тестах мультимодального анализа документов, изображений, видео и аудио и может генерировать высококачественные изображения, аналогичные другим ведущим моделям генерации изображений», — говорится в пресс-материалах AWS о новой модели Omni.

ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Прежде чем присоединиться к The New Stack в качестве старшего редактора по искусственному интеллекту, Фредерик был корпоративным редактором в TechCrunch, где освещал все, от появления облака и первых дней Kubernetes до появления квантовых вычислений…. Подробнее от Фредерика Лардинуа

Разработка сайтов в Гомеле

Добавить комментарий Отменить ответ

Похожие записи

Как заполнить трещины с открытым исходным кодом в основе контейнера

Qodo теперь позволяет разработчикам создавать свои собственные кодирующие агенты

Переосмысление DevSecops: безопасность программного обеспечения для безопасности программного обеспечения

Избегание налога на надежность агента AI: Руководство разработчика

Руководство разработчика по серверу JavaScript

Программное обеспечение для безопасности Linux обратилось против пользователей

Почему нативная инфраструктура облаков не подлежит обсуждению для Genai

Делегирование против сотрудничества в эпоху разработки программного обеспечения с двигателем AI

Почему только ИИ терпит неудачу при крупномасштабной модернизации кода

Где тесты ИИ терпят неудачу и как оценить модели вместо этого

Внедренная агентом MongoDB Mondernization Modernization

Новые ИИ-агенты OpenSearch 3.3 теперь общедоступны для разработчиков

Вам тоже может быть интересно:

Птицы сокращают 120 рабочих мест, как часть «стратегического перестройки»

Бывший директор CISA Крис Кребс клянется бороться с федеральным расследованием, упорядоченным Трампом

Amazon раскрывает новую модель AI Voice, Nova Sonic

CINO рассылает счет в момент оплаты, поднимает семена

Как взрыв водорода привел к тому, что подростка стал первым защитным технологическим инвестициями Sequoia.

YouTube рассматривает ежедневный таймер для пользователей, желающих сократить шорты

Microsoft отменяет некоторые из своих центров обработки данных AI

Google хочет, чтобы поиск был больше похож на помощника искусственного интеллекта в 2025 году

Выпуск Nintendo Switch 2 5 июня и стоит 450 долларов

Palantir Exec защищает работу иммиграционного наблюдения компании

Индия расширяет аутентификацию Aadhaar для предприятий, выявляя проблемы конфиденциальности

Бельгия, расследуя предполагаемую кибератаку о разведывательном агентстве хакеры, связанные с Китаем