Новости 20:37, 29 июня 2026
Поделиться

DeepSeek выпустил коллекцию ускоренных моделей DeepSpec для локального развёртывания

Китайский разработчик искусственного интеллекта DeepSeek представил набор открытых моделей DeepSpec, оптимизированных для локального использования на базе архитектур Qwen3 и Gemma4. Анонс состоялся 28 июня.

Компания DeepSeek, известная своими открытыми моделями ИИ, выпустила новую коллекцию ускоренных моделей DeepSpec. Пакет предназначен для развёртывания на локальных устройствах и основан на архитектурах Qwen3 (от Alibaba Cloud) и Gemma4 (от Google DeepMind). Модели оптимизированы для повышения производительности при работе на ограниченных вычислительных ресурсах, что делает их привлекательными для корпоративных и исследовательских применений.

По словам представителей DeepSeek, DeepSpec включает версии с различными параметрами, адаптированные под разные сценарии использования — от мобильных устройств до серверных решений. В компании подчёркивают, что модели сохраняют баланс между точностью и скоростью обработки данных, что особенно важно для задач, требующих низких задержек. Технические детали и бенчмарки опубликованы в блоге разработчиков.

Анонс вызвал интерес в сообществе разработчиков ИИ. Эксперты отмечают, что DeepSeek продолжает укреплять позиции на рынке открытых моделей, конкурируя с такими проектами, как Llama от Meta и Mistral AI. Ранее компания уже выпускала модели с открытыми весами, включая DeepSeek-V2, которая получила высокую оценку за соотношение цены и качества.

Выпуск DeepSpec может ускорить внедрение локальных ИИ-решений в отраслях, где критичны вопросы конфиденциальности данных или ограничен доступ к облачным ресурсам. В DeepSeek не раскрывают планы по коммерциализации новой коллекции, но подчёркивают приверженность принципам открытого исходного кода.

Источники: X-пост Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞), 28 июня; блог DeepSeek.