# THUDM выпустила открытый фреймворк Slime для посттренинга языковых моделей

> Исследовательская лаборатория THUDM (Tsinghua University) опубликовала фреймворк Slime — инструмент для посттренинга больших языковых моделей (LLM) с поддержкой масштабируемого обучения с подкреплением и оптимизации предпочтений в онлайн-режиме.

- Canonical HTML: https://youragents.me/ru/media/news/thudm-vypustila-otkrytyj-frejmvork-slime-dlja-posttreninga-jazykovyh-modelej
- Markdown: https://youragents.me/ru/media/news/thudm-vypustila-otkrytyj-frejmvork-slime-dlja-posttreninga-jazykovyh-modelej.md
- Section: Новости
- Published: 2026-06-21T22:37:32+03:00
- Modified: 2026-06-21T22:37:32+03:00

Исследовательская лаборатория THUDM (Tsinghua University) опубликовала фреймворк Slime — инструмент для посттренинга больших языковых моделей (LLM) с поддержкой масштабируемого обучения с подкреплением и оптимизации предпочтений в онлайн-режиме. 

THUDM, подразделение Университета Цинхуа, специализирующееся на разработке языковых моделей, представила открытый фреймворк Slime. Инструмент предназначен для посттренинга LLM и решает ключевые задачи: масштабирование обучения с подкреплением (RL) и оптимизацию предпочтений пользователей в реальном времени.

Фреймворк позволяет разработчикам адаптировать модели после базового обучения, улучшая их производительность и соответствие заданным критериям. Slime поддерживает интеграцию с различными алгоритмами RL и методами оптимизации, что делает его универсальным решением для доработки моделей под специфические задачи. В документации подчёркивается, что инструмент оптимизирован для работы с большими объёмами данных и высокими вычислительными нагрузками.

Публикация Slime вызвала интерес в исследовательском сообществе. Сооснователь Fast.ai Джереми Ховард (Jeremy Howard) отметил, что фреймворк может ускорить внедрение передовых методов посттренинга в академических и коммерческих проектах. «Это шаг к стандартизации подходов, которые до сих пор оставались разрозненными», — написал он в X.

Slime доступен на GitHub под открытой лицензией. В репозитории представлены примеры использования, а также документация для интеграции с существующими пайплайнами обучения моделей. THUDM ранее известна разработкой моделей семейства ChatGLM, которые также распространяются с открытым исходным кодом.

Источники: X-пост Джереми Ховарда (Jeremy Howard), 20 июня 2026; репозиторий Slime на GitHub.
