Новости 08:00, 2 июня 2026
Поделиться

NVIDIA представила открытую модель Nemotron 3 Ultra с рекордно быстрым выводом

Компания NVIDIA выпустила новую языковую модель Nemotron 3 Ultra на 550 млрд параметров, которая, по её данным, обеспечивает в пять раз более быстрый инференс и на 30% снижает затраты по сравнению с аналогами.

NVIDIA объявила о запуске Nemotron 3 Ultra — открытой модели на базе архитектуры SSM-MoE (State Space Model — Mixture of Experts) с 550 млрд параметров. Модель позиционируется как решение для высокопроизводительного инференса: по заявлениям компании, она работает в пять раз быстрее существующих аналогов при снижении стоимости на 30%. Технические детали и бенчмарки будут опубликованы в блоге NVIDIA.

Модель доступна для коммерческого использования под лицензией Apache 2.0, что позволяет разработчикам модифицировать и внедрять её без ограничений. В NVIDIA подчёркивают, что Nemotron 3 Ultra оптимизирована для работы на графических процессорах компании, включая последние поколения ускорителей.

По словам вице-президента NVIDIA по прикладному глубокому обучению Брайана Катанзаро (Bryan Catanzaro), «новая архитектура сочетает преимущества SSM и MoE, обеспечивая баланс между точностью и эффективностью». Катанзаро также отметил, что модель может стать основой для корпоративных и исследовательских проектов, требующих высокой скорости обработки данных.

Ранее NVIDIA уже выпускала открытые модели, но Nemotron 3 Ultra выделяется масштабом и целевой оптимизацией под инференс. В отрасли это воспринимается как шаг к снижению зависимости от проприетарных решений, таких как модели от OpenAI или Anthropic.

Источники: X-пост Брайана Катанзаро (Bryan Catanzaro), 1 июня 2026; блог NVIDIA.