Китайская платформа доставки Meituan представила модель LongCat-2.0 — открытую модель смешанного типа (MoE) с 1,6 трлн параметров, обученную на 50 тыс. специализированных ASIC-процессоров собственной разработки. Об этом сообщили участники технологического сообщества в соцсети X.
Meituan стала первым крупным игроком за пределами США и КНР, который опубликовал модель с открытыми весами такого масштаба. LongCat-2.0 построена по архитектуре смешанных экспертов (Mixture of Experts), что позволяет оптимизировать вычислительные затраты при сохранении высокой точности. Модель обучена преимущественно на китайскоязычных данных, включая корпоративные массивы Meituan, и ориентирована на применение в логистике, рекомендательных системах и обработке естественного языка.
Ключевая особенность проекта — использование 50 тыс. ASIC-чипов, разработанных инженерами Meituan. По словам Александра Дориа (Alexander Doria), исследователя в области аппаратного ускорения ИИ, это крупнейшая на сегодняшний день инсталляция специализированных процессоров для обучения моделей. «Масштаб впечатляет: 50 тыс. ASIC — это эквивалент 15–20 тыс. топовых GPU, но с энергоэффективностью в 2–3 раза выше», — отметил он в комментарии на X.
Представители Meituan не раскрыли детали архитектуры чипов, однако подчеркнули, что они оптимизированы для работы с разреженными матрицами — ключевым элементом MoE-моделей. В компании также заявили о планах расширить инфраструктуру до 100 тыс. ASIC к концу 2026 г., что позволит обучать модели с 5 трлн параметров.
Эксперты отмечают, что LongCat-2.0 может стать конкурентом закрытым моделям от Alibaba и Tencent, особенно в сегменте корпоративных решений. Леннарт Хайм (Lennart Heim), исследователь из Центра безопасности ИИ, указал на потенциал открытых моделей в снижении зависимости от западных технологий: «Китайские компании активно инвестируют в собственные аппаратные платформы, и Meituan здесь задаёт новый стандарт».