ЛАС-ВЕГАС — Сегодня на конференции re:Invent в Лас-Вегасе компания AWS представила последнее поколение моделей фундаментов Nova. Nova 2 Lite, Pro и Sonic, а также новая модель Omni, которая является новой для семейства и может принимать текст, аудио, изображения и видео в качестве входных данных и выводить текст и изображения.
AWS анонсировала первый набор моделей Nova на прошлогодней выставке re:Invent и со временем выпустила ряд дополнительных моделей для генерации изображений, видео и других вариантов использования. Однако по большей части эти модели так и не завоевали такого же внимания, как модели других производителей, и к настоящему времени эти оригинальные модели значительно отстают от самых современных моделей из передовых лабораторий, таких как Anthropic, OpenAI и Google, а также от многих моделей с открытым весом.
Однако с этим новым выпуском AWS догоняет его, и компания не боится ссылаться на тесты, которые сравнивают эти модели с текущими передовыми моделями (многие из которых были запущены только в последние несколько недель).
Что касается цен, новые модели будут иметь конкурентоспособную цену в размере 0,3/2,5 доллара сша за миллион токенов ввода/вывода для модели Lite. За модели Pro и Omni AWS взимает разные цены в зависимости от формата. Для модели Pro они начинаются с 1,25/10 долларов сша за миллион токенов ввода/вывода для текстовой модели.
Семейство моделей AWS Nova 2 (Фото: AWS).
Нова 1 Лайт
Например, версия Lite, которая, по утверждению AWS, идеально подходит для использования в сценариях обслуживания клиентов, обработки документов и автоматизации рабочих процессов, является конкурентоспособной и иногда превосходит по производительности такие модели, как Claude Haiku 4.5 от Anthropic и GPT-5-mini от OpenAI (и Gemini Flash 2.5 от Google, но на данный момент это более старая модель).
Основная философия этой модели, как и в семействе Haiku от Anthropic, заключается в поиске правильного компромисса между скоростью и стоимостью.
Тесты Nova 2 Lite (фото: AWS).
Модель Nova 2 Lite также поддерживает новый сервис AWS Nova Act, новый сервис для управления агентами, использующими браузер. AWS утверждает, что Nova Act обеспечивает 90% надежности протестированных ею рабочих процессов клиентов.
Нова 2 Про
Nova Pro — это самая интеллектуальная модель рассуждения AWS, утверждает компания, которая превосходно справляется с задачами, требующими точности, анализа нескольких документов, рассуждений над изображениями и видео, а также задач кодирования. Тесты ставят его в один ряд с Claude Sonnet 4.5 и GPT-5- и GPT-5.1, а также с предварительной версией Gemini 3 от Google (поскольку Gemini 3 был запущен только на прошлой неделе, AWS еще не предоставила тесты для окончательной версии Gemini 3).
Было бы неплохо увидеть сравнение с Opus 4.5 от Anthropic, поскольку он превзошел Gemini 3 Pro во многих тестах, но стоит отметить, что Nova 2 Pro превзошел или сравнялся с Gemini 3 Pro только в 8 из 18 тестов.
Как отмечает AWS, October 2 Pro также можно использовать в качестве модели преподавателя для дистилляции знаний.
Тесты Nova 2 Pro (Фото: AWS).
Нова 2 Соник
Соник — это своего рода специализированная модель. Это модель преобразования речи в речь, которая, вероятно, лучше всего подходит для решений контакт-центров, таких как собственный сервис Amazon Connect, и других вариантов использования помощников с искусственным интеллектом.
Он предназначен для создания человеческих разговоров в реальном времени на нескольких языках с выразительными голосами. Он может переключаться между голосом и текстом по мере необходимости, а его окно токенов составляет один миллион токенов, что позволяет ему сохранять контекст в долгих разговорах.
Нова 2 Омни
Omni — новое пополнение в семействе Nova. AWS описывает ее как «первую унифицированную мультимодальную модель мышления». Он может обрабатывать текст, изображения, видео и аудио в качестве входных данных и создавать как текстовые, так и графические выходные данные.
AWS утверждает, что модель может обрабатывать эквивалент 750 000 слов контекста (по какой-то причине в материалах AWS не указано количество токенов, которое может обрабатывать модель).
«Хотя в отрасли нет моделей, сопоставимых с Nova 2 Omni, она демонстрирует сильные стороны в общедоступных тестах мультимодального анализа документов, изображений, видео и аудио и может генерировать высококачественные изображения, аналогичные другим ведущим моделям генерации изображений», — говорится в пресс-материалах AWS о новой модели Omni.
ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Прежде чем присоединиться к The New Stack в качестве старшего редактора по искусственному интеллекту, Фредерик был корпоративным редактором в TechCrunch, где освещал все, от появления облака и первых дней Kubernetes до появления квантовых вычислений…. Подробнее от Фредерика Лардинуа