Инженер-исследователь компании Prime Intellect Флориан Бранд (Florian Brand) заявил о переходе на использование модели Gemma 4 с 6-битным квантованием (E4B) в качестве основного локального большого языкового модели (LLM) на компьютерах Mac.
Флориан Бранд, инженер-исследователь в Prime Intellect, опубликовал пост, в котором сообщил о выборе Gemma 4 в качестве основной локальной модели для работы на устройствах Apple. Модель используется в формате 6-битного квантования (E4B), что позволяет оптимизировать её производительность на аппаратном обеспечении Mac без значительных потерь в качестве.
По словам Бранда, такой подход обеспечивает баланс между скоростью работы и точностью генерации текста, что критически важно для задач, связанных с разработкой и тестированием моделей. Gemma 4, разработанная Google DeepMind, позиционируется как одна из наиболее эффективных открытых моделей для локального развёртывания, особенно на устройствах с ограниченными вычислительными ресурсами.
Ранее аналогичные эксперименты с квантованием моделей для Mac проводили и другие разработчики, однако переход Бранда на Gemma 4 в качестве основного инструмента может свидетельствовать о зрелости технологии для повседневного использования. В своём посте инженер не раскрыл детали конфигурации или конкретные метрики производительности, но отметил, что модель «полностью удовлетворяет» его потребности в работе.
Prime Intellect, где работает Бранд, специализируется на разработке инструментов для оптимизации и развёртывания больших языковых моделей. Компания не комментировала выбор своего сотрудника, однако публикация может стимулировать интерес к локальным решениям на базе Gemma среди разработчиков, работающих на платформе Apple.
Источники: X-пост Флориана Бранда (Florian Brand), 7 июня 2026 года.