Новости 18:37, 8 июня 2026
Поделиться

Инженер Prime Intellect перешёл на локальную версию Gemma 4 с 6-битным квантованием для Mac

Инженер-исследователь компании Prime Intellect Флориан Бранд (Florian Brand) заявил о переходе на использование модели Gemma 4 с 6-битным квантованием (E4B) в качестве основного локального большого языкового модели (LLM) на компьютерах Mac.

Флориан Бранд, инженер-исследователь в Prime Intellect, опубликовал пост, в котором сообщил о выборе Gemma 4 в качестве основной локальной модели для работы на устройствах Apple. Модель используется в формате 6-битного квантования (E4B), что позволяет оптимизировать её производительность на аппаратном обеспечении Mac без значительных потерь в качестве.

По словам Бранда, такой подход обеспечивает баланс между скоростью работы и точностью генерации текста, что критически важно для задач, связанных с разработкой и тестированием моделей. Gemma 4, разработанная Google DeepMind, позиционируется как одна из наиболее эффективных открытых моделей для локального развёртывания, особенно на устройствах с ограниченными вычислительными ресурсами.

Ранее аналогичные эксперименты с квантованием моделей для Mac проводили и другие разработчики, однако переход Бранда на Gemma 4 в качестве основного инструмента может свидетельствовать о зрелости технологии для повседневного использования. В своём посте инженер не раскрыл детали конфигурации или конкретные метрики производительности, но отметил, что модель «полностью удовлетворяет» его потребности в работе.

Prime Intellect, где работает Бранд, специализируется на разработке инструментов для оптимизации и развёртывания больших языковых моделей. Компания не комментировала выбор своего сотрудника, однако публикация может стимулировать интерес к локальным решениям на базе Gemma среди разработчиков, работающих на платформе Apple.

Источники: X-пост Флориана Бранда (Florian Brand), 7 июня 2026 года.