Новости 18:37, 27 мая 2026
Поделиться

PrismML выпустила 1-битную диффузионную модель для генерации изображений на смартфонах

Стартап PrismML представил семейство моделей Bonsai Image 4B, способных генерировать изображения на устройствах с ограниченными вычислительными ресурсами — от ноутбуков до смартфонов. Модель весом 930 МБ выполняет инференс за девять секунд, используя 1-битное и троичное квантование.

Компания PrismML, специализирующаяся на разработке эффективных моделей машинного обучения, анонсировала выпуск Bonsai Image 4B — нового семейства диффузионных моделей для генерации изображений. Особенность решения заключается в оптимизации под локальное выполнение на устройствах с низкой производительностью, включая смартфоны и ноутбуки. Модель использует 1-битное и троичное квантование, что позволяет сократить её размер до 930 МБ без значительной потери качества.

По словам сооснователя PrismML Роана Анила (Rohan Anil), Bonsai Image 4B предназначена для «высококачественного диффузионного инференса на локальном оборудовании». Время генерации одного изображения составляет около девяти секунд, что делает технологию пригодной для практического применения на мобильных устройствах. Анил не уточнил, какие именно аппаратные платформы поддерживаются, однако подчеркнул, что модель адаптирована для работы на «широком спектре устройств».

Выбор названия «Bonsai» вместо привычного «Flux» вызвал вопросы в сообществе. Исследователь Симо Рю (Simo Ryu) в комментарии к анонсу отметил, что PrismML не упоминает связь с архитектурой Flux, на базе которой, предположительно, построена новая модель. «Почему они называют квантованный Flux совершенно новым именем? Это напоминает тренд на переименование оптимизаторов после незначительных модификаций», — написал Рю. Его пост собрал более 7 тыс. просмотров.

Лукас Нестлер (Lucas Nestler), инженер из компании Mistral AI, в свою очередь отметил, что команда PrismML «многое узнала о квантовании» в процессе работы над моделью. Подробности технической реализации пока не раскрываются, однако в блоге компании ранее сообщалось о разработке методов квантования для диффузионных моделей.

Решение PrismML может стать важным шагом в направлении децентрализации генеративных моделей, снижая зависимость от облачных вычислений. Если технология подтвердит свою эффективность на массовых устройствах, это откроет новые возможности для приложений в области мобильной фотографии, дизайна и дополненной реальности.

Источники: X-пост Роана Анила (Rohan Anil), 26 мая 2026; X-пост Симо Рю (Simo Ryu), 26 мая 2026; блог PrismML.