Новости 22:00, 20 июня 2026

Китайская лаборатория THUDM открыла код фреймворка для масштабирования обучения ИИ-моделей

Исследовательская группа THUDM из Университета Цинхуа опубликовала исходный код фреймворка Slime, который использовался для обучения языковой модели GLM-5.2 компании Zhipu AI. Инструмент предназначен для масштабирования обучения с подкреплением и теперь доступен разработчикам.

Команда THUDM (Tsinghua University & Zhipu AI Joint Lab for Human-Aligned Large Models) выложила в открытый доступ фреймворк Slime, ранее применённый для тренировки модели GLM-5.2. Инструмент оптимизирует процесс обучения с подкреплением, позволяя эффективнее масштабировать вычислительные ресурсы при работе с крупными языковыми моделями.

Slime представляет собой набор библиотек и алгоритмов, которые автоматизируют распределение задач между GPU и управляют динамической балансировкой нагрузки. По словам разработчиков, фреймворк сокращает время обучения на 30–40% по сравнению с традиционными методами, сохраняя при этом стабильность процесса. В документации подчёркивается, что Slime совместим с популярными фреймворками глубокого обучения, включая PyTorch и JAX.

Публикация кода состоялась на фоне растущего интереса к методам обучения с подкреплением для языковых моделей. Ранее аналогичные инструменты открывали такие компании, как DeepMind (Acme) и Meta (Habitat), однако Slime отличается фокусом на оптимизацию для крупномасштабных систем. В репозитории на GitHub уже доступны примеры интеграции с моделями семейства GLM, а также базовые сценарии для воспроизведения результатов.

«Мы надеемся, что Slime ускорит исследования в области обучения с подкреплением, особенно для команд с ограниченными вычислительными ресурсами», — отметил один из авторов проекта, исследователь THUDM Лун Ван (Lun Wang). В ближайших планах разработчиков — добавление поддержки новых архитектур и расширение документации для корпоративных пользователей.

Источники: X-пост Teortaxes, 19 июня; репозиторий Slime на GitHub; блог THUDM.

Еще новости

Стартап Figure прогнозирует превышение парка человекоподобных роботов над штатом сотрудников к середине 2026 года

Исследователь Anthropic назвала гонку за ИИ-рисками стратегией компании

Исследователь представил новый бенчмарк для обучения ИИ на задачах Sokoban за 87 минут