Стартап Cursor, разработчик ИИ-ассистента для программистов, представил предварительные результаты обучения модели Composer 3 — крупнейшей на сегодняшний день языковой модели общего назначения с 1,5 трлн параметров. Обучение проводилось на кластере из 100 тыс. графических процессоров.
Cursor, компания, стоящая за одноимённым ИИ-инструментом для разработчиков, раскрыла детали обучения новой языковой модели Composer 3. По словам основателей проекта, модель содержит 1,5 трлн параметров — в несколько раз больше, чем у крупнейших существующих аналогов, таких как GPT-4 или Gemini Ultra. Обучение велось на кластере из 100 тыс. GPU, что делает Composer 3 одной из самых ресурсоёмких моделей в истории.
Анонс был сделан в серии постов в X (Twitter) ключевыми участниками проекта. Сооснователь Cursor Лун Ван (Lun Wang) отметил, что модель продемонстрировала «беспрецедентную обобщающую способность» на этапе предварительного тестирования, хотя точные метрики качества пока не раскрываются. Другой сооснователь, Виктор Тейлин (Victor Taelin), подчеркнул, что Composer 3 создавалась как универсальная платформа для решения задач не только в программировании, но и в других областях, включая научные исследования и анализ данных.
Обучение модели такого масштаба требует значительных вычислительных мощностей. По оценкам экспертов, использование 100 тыс. GPU эквивалентно нескольким месяцам непрерывной работы на современном суперкомпьютере. Cursor не раскрывает подробности инфраструктуры, но, по словам аналитиков, такой проект мог потребовать инвестиций в сотни миллионов долларов. Ранее компания привлекала финансирование от ведущих венчурных фондов, включая Andreessen Horowitz.
Официальный релиз Composer 3 ожидается в конце 2026 года. В Cursor утверждают, что модель будет доступна как через облачный API, так и в виде локальной версии для корпоративных клиентов. В блоге компании также упоминается, что часть результатов обучения будет опубликована в открытом доступе для исследовательского сообщества.