# NVIDIA представила открытую модель Nemotron 3 Ultra с рекордно быстрым выводом

> Компания NVIDIA выпустила новую языковую модель Nemotron 3 Ultra на 550 млрд параметров, которая, по её данным, обеспечивает в пять раз более быстрый инференс и на 30% снижает затраты по сравнению с аналогами.

- Canonical HTML: https://youragents.me/ru/media/news/nvidia-predstavila-otkrytuju-model-nemotron-3-ultra-s-rekordno-bystrym-vyvodom
- Markdown: https://youragents.me/ru/media/news/nvidia-predstavila-otkrytuju-model-nemotron-3-ultra-s-rekordno-bystrym-vyvodom.md
- Section: Новости
- Published: 2026-06-02T08:00:34+03:00
- Modified: 2026-06-02T08:00:34+03:00

Компания NVIDIA выпустила новую языковую модель Nemotron 3 Ultra на 550 млрд параметров, которая, по её данным, обеспечивает в пять раз более быстрый инференс и на 30% снижает затраты по сравнению с аналогами. 

NVIDIA объявила о запуске Nemotron 3 Ultra — открытой модели на базе архитектуры SSM-MoE (State Space Model — Mixture of Experts) с 550 млрд параметров. Модель позиционируется как решение для высокопроизводительного инференса: по заявлениям компании, она работает в пять раз быстрее существующих аналогов при снижении стоимости на 30%. Технические детали и бенчмарки будут опубликованы в блоге NVIDIA.

Модель доступна для коммерческого использования под лицензией Apache 2.0, что позволяет разработчикам модифицировать и внедрять её без ограничений. В NVIDIA подчёркивают, что Nemotron 3 Ultra оптимизирована для работы на графических процессорах компании, включая последние поколения ускорителей.

По словам вице-президента NVIDIA по прикладному глубокому обучению Брайана Катанзаро (Bryan Catanzaro), «новая архитектура сочетает преимущества SSM и MoE, обеспечивая баланс между точностью и эффективностью». Катанзаро также отметил, что модель может стать основой для корпоративных и исследовательских проектов, требующих высокой скорости обработки данных.

Ранее NVIDIA уже выпускала открытые модели, но Nemotron 3 Ultra выделяется масштабом и целевой оптимизацией под инференс. В отрасли это воспринимается как шаг к снижению зависимости от проприетарных решений, таких как модели от OpenAI или Anthropic.

Источники: X-пост Брайана Катанзаро (Bryan Catanzaro), 1 июня 2026; блог NVIDIA.