Nvidia выпускает следующее поколение своих моделей Nemotron

Сегодня компания Nvidia представила новейший набор моделей искусственного интеллекта из серии Nemotron с открытым исходным кодом для питания агентов искусственного интеллекта: Nemotron 3 Nano, Super и Ultra. Впервые Nvidia также выпускает не только модели, но и данные предварительного обучения на сумму три триллиона токенов и 18 миллионов образцов данных после обучения. Благодаря существующим средам обучения Nvidia, для которых компания также запускает 10 новых сред для спортивных залов, а также библиотекам обучения с подкреплением с открытым исходным кодом, разработчики также смогут легко использовать эти модели и обучать их для своих собственных сценариев использования.

Модель Nano доступна уже сейчас, а модели Super и Ultra, как ожидается, появятся в продаже в первой половине 2026 года.

Семейство моделей Nemotron 3

Что касается самих моделей, то это первое из семейств Nemotron, использующее метод объединения экспертов (MoE), который по существу отделяет размер модели от стоимости вычислений, сохраняя активным только подмножество параметров в любой момент времени. Это, в свою очередь, означает, что эти новые модели значительно быстрее: Nvidia утверждает, что модель Nemotron 3 Nano с 30 миллиардами параметров (с 3 миллиардами активных параметров благодаря этой технологии MoE) почти в 4 раза более производительна, чем эквивалентная модель Nemotron 2 Nano. Он также генерирует на 60% меньше жетонов рассуждений для создания ответов, что еще больше снизит стоимость использования этой модели. Это также одна из немногих моделей с открытым исходным кодом, предлагающая контекстное окно в 1 миллион токенов.

Модель Nano, которая, по словам Nvidia, должна особенно хорошо работать для целевых задач, теперь доступна на HuggingFace.

Модель Nemotron 3 Super представляет собой модель со 100 миллиардами параметров и 10 миллиардами активных параметров, предназначенную для мультиагентных приложений. Модель Nemotron 3 Ultra имеет 500 миллиардов параметров и 50 миллиардов активных, и хотя она станет самой умной из новых моделей и отлично подходит для более сложных приложений, она также будет самой дорогой в эксплуатации.

Кредит: Нвидиа.

Nvidia не предоставила прессе подробные тесты до введения эмбарго. На данный момент компания заявила лишь то, что «Artificial Analysis, независимая организация, которая тестирует искусственный интеллект, оценила эту модель как наиболее открытую и эффективную среди моделей того же размера, с лидирующей точностью».

Вы можете получить немного больше информации о том, где находится модель Nano, из приведенного ниже графика искусственного анализа, который ставит Nemotron 3 Nano на тот же уровень, что и OpenAI GPT-OSS-20B (высокий), Qwen 3 30B и Qwen 3 VL 32B, хотя и с гораздо более высокой скоростью вывода токенов в секунду. Модель April Thinking от ServiceNow значительно медленнее, но немного опережает модель Nano по индексу интеллекта Искусственного анализа.

Тест Nvidia Nemotron 3 Nano по данным искусственного анализа. Кредит: Нвидиа.

Доступность

Учитывая природу этих новых моделей с открытым исходным кодом и лицензию, разработчики смогут запускать их самостоятельно, если у них есть необходимое оборудование в виде микросервиса Nvidia NIM, но они также будут доступны через коммерческих поставщиков и другие платформы, включая общедоступные облака, такие как Amazon Bedrock (бессерверные), а вскоре и в Google Cloud, Coreweave, Nebius, Nscale и Yotta.

Сервисы вывода, такие как Baseten, Deepinfra, Fireworks, FriendliAI, OpenRouter и Together AI, также будут предлагать его, а также такие платформы, как Couchbase, DataRobot, H2O.AI, JFrog, Lambda и UiPath.

Почему Nvidia создает свои собственные модели

Хотя Nvidia более известна созданием аппаратных ускорителей, на которых было обучено подавляющее большинство крупных языковых моделей, путь компании к созданию собственных моделей начался в 2019 году с модели Megatron-LM. Первые модели под брендом Nemotron, выпущенные в 2024 году, имеют модель рассуждения, основанную на Llama 3.1 от Meta. С тех пор Nvidia выпустила довольно много моделей Nemotron разных размеров и настроенных для конкретных случаев использования, причем все они получили относительно либеральные лицензии, которые позволяли таким компаниям, как ServiceNow, настраивать эти модели для своих собственных сценариев использования.

Отвечая на вопрос, почему Nvidia создает свои собственные модели на пресс-конференции перед сегодняшним объявлением и пытается ли компания стать передовым разработчиком моделей, Кари Бриски, вице-президент по генеративному искусственному интеллекту для предприятий в Nvidia, отметила, что часть идеи здесь заключается в том, чтобы довести собственное оборудование компании до предела как в обучении, так и в построении моделей.

«Мне не пришлось бы говорить: «Это конкуренция?» Это для того, чтобы построить его для себя, и мы даем его экосистеме, чтобы она могла ему доверять и развиваться», — объяснила она.

По мнению Бриски, именно поэтому Nvidia заинтересована в построении открытой экосистемы вокруг своих моделей — и создания моделей в целом. «Если мы считаем, что генеративный искусственный интеллект и большие языковые модели являются (а мы так и делаем) платформой разработки будущего, я смотрю на эти LLM как на библиотеку. А что нам делать с библиотеками? Мы размещаем их там для [developers] чтобы проверить код, чтобы вы могли его понять, чтобы вы могли на нем основываться, чтобы мы могли исправлять ошибки, чтобы мы могли его улучшить, а затем выложить его обратно. Поэтому чем больше мы будем об этом рассказывать, тем больше будет вовлеченность разработчиков».

ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Прежде чем присоединиться к The New Stack в качестве старшего редактора по искусственному интеллекту, Фредерик был корпоративным редактором в TechCrunch, где освещал все, от появления облака и первых дней Kubernetes до появления квантовых вычислений…. Подробнее от Фредерика Лардинуа

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *