Компания NVIDIA выпустила новую языковую модель Nemotron 3 Ultra на 550 млрд параметров, которая, по её данным, обеспечивает в пять раз более быстрый инференс и на 30% снижает затраты по сравнению с аналогами.
NVIDIA объявила о запуске Nemotron 3 Ultra — открытой модели на базе архитектуры SSM-MoE (State Space Model — Mixture of Experts) с 550 млрд параметров. Модель позиционируется как решение для высокопроизводительного инференса: по заявлениям компании, она работает в пять раз быстрее существующих аналогов при снижении стоимости на 30%. Технические детали и бенчмарки будут опубликованы в блоге NVIDIA.
Модель доступна для коммерческого использования под лицензией Apache 2.0, что позволяет разработчикам модифицировать и внедрять её без ограничений. В NVIDIA подчёркивают, что Nemotron 3 Ultra оптимизирована для работы на графических процессорах компании, включая последние поколения ускорителей.
По словам вице-президента NVIDIA по прикладному глубокому обучению Брайана Катанзаро (Bryan Catanzaro), «новая архитектура сочетает преимущества SSM и MoE, обеспечивая баланс между точностью и эффективностью». Катанзаро также отметил, что модель может стать основой для корпоративных и исследовательских проектов, требующих высокой скорости обработки данных.
Ранее NVIDIA уже выпускала открытые модели, но Nemotron 3 Ultra выделяется масштабом и целевой оптимизацией под инференс. В отрасли это воспринимается как шаг к снижению зависимости от проприетарных решений, таких как модели от OpenAI или Anthropic.
Источники: X-пост Брайана Катанзаро (Bryan Catanzaro), 1 июня 2026; блог NVIDIA.