Новости 23:37, 4 июня 2026
Поделиться

Исследователь из Cornell Tech предложил метод исправления ошибок больших языковых моделей с помощью самообучения

Профессор Корнеллского университета Саша Раш (Sasha Rush) опубликовал описание техники целевой самообучающей дистилляции с использованием обратной связи (targeted on-policy self-distillation), которая позволяет корректировать конкретные ошибки в выводах больших языковых моделей (LLM) без полного переобучения.

Саша Раш, доцент Корнеллского технологического института (Cornell Tech) и научный сотрудник компании Hugging Face, представил подход, направленный на устранение систематических ошибок в работе LLM. Метод предполагает выявление некорректных ответов модели на этапе развёртывания (rollout) и последующую корректировку её поведения с помощью механизма самообучения.

В основе техники лежит идея целевого воздействия на политику модели (on-policy) — вместо глобальной оптимизации алгоритм фокусируется на исправлении конкретных дефектов. Как поясняет Раш, это позволяет избежать проблем, связанных с дрейфом модели (model drift), который часто возникает при традиционных методах дообучения. Техника использует данные обратной связи, собранные в процессе эксплуатации, для формирования новых обучающих примеров, которые затем применяются для корректировки весов модели.

По словам автора, предложенный метод особенно эффективен в сценариях, где требуется высокая точность ответов, например, в медицинских или юридических приложениях. Раш подчёркивает, что техника не требует значительных вычислительных ресурсов, так как не предполагает полного переобучения модели. «Это как точечная хирургия для LLM — мы исправляем только те части, которые работают некорректно», — отметил исследователь.

Работа вызвала интерес в сообществе специалистов по машинному обучению. Эксперты отмечают, что подход может стать альтернативой традиционным методам обучения с подкреплением (RLHF), которые часто критикуют за высокую стоимость и сложность реализации. Подробности метода опубликованы в блоге автора и в репозитории на платформе GitHub.

Источники: X-пост Саши Раша (Sasha Rush), 4 июня 2026; блог автора.