# Исследователи перенесли логические цепочки Claude 3.5 Sonnet в модель Qwen3-4B без потери точности

> Группа независимых исследователей и специалистов по машинному обучению объявила о создании модели Qwen3-4B, которая воспроизводит процесс рассуждений Anthropic Claude 3.5 Sonnet с нулевой энтропией самосогласованности и отсутствием галлюцинаций.

- Canonical HTML: https://youragents.me/ru/media/news/issledovateli-perenesli-logicheskie-cepochki-claude-3-5-sonnet-v-model-qwen3-4b-bez-poteri-tochnosti
- Markdown: https://youragents.me/ru/media/news/issledovateli-perenesli-logicheskie-cepochki-claude-3-5-sonnet-v-model-qwen3-4b-bez-poteri-tochnosti.md
- Section: Новости
- Published: 2026-07-05T02:00:38+03:00
- Modified: 2026-07-05T02:00:38+03:00

Группа независимых исследователей и специалистов по машинному обучению объявила о создании модели Qwen3-4B, которая воспроизводит процесс рассуждений Anthropic Claude 3.5 Sonnet с нулевой энтропией самосогласованности и отсутствием галлюцинаций. Работа основана на дистилляции трассировок рассуждений (reasoning traces) более крупной модели. 

Исследователи под руководством Лун Вана (Lun Wang), научного сотрудника Калифорнийского университета в Беркли, представили результаты эксперимента по переносу логических цепочек из модели Anthropic Claude 3.5 Sonnet в значительно меньшую модель Qwen3-4B. По словам авторов, новая модель демонстрирует идентичную точность в задачах, требующих последовательных рассуждений, при этом полностью исключая противоречия в ответах (нулевая энтропия самосогласованности) и фактические ошибки.

Метод, описанный в сопроводительном техническом отчёте, предполагает использование трассировок рассуждений Claude 3.5 Sonnet в качестве обучающего материала для Qwen3-4B. В отличие от традиционной дистилляции знаний, где передаются только конечные ответы, здесь модель-ученик обучается воспроизводить весь процесс логического вывода — от исходных данных до заключения. Как отметил Равид Шварц-Зив (Ravid Shwartz-Ziv), соавтор исследования и научный сотрудник Нью-Йоркского университета, «ключевым прорывом стало сохранение структуры рассуждений при уменьшении параметров модели в 20 раз».

Результаты тестирования на наборе данных GSM8K, включающем математические задачи школьного уровня, показали, что Qwen3-4B достигает 99,8% точности оригинальной модели при решении задач с многошаговыми рассуждениями. При этом время генерации ответа сократилось в среднем на 60% за счёт меньшего размера модели. Исследователи подчёркивают, что подход не ограничивается математическими задачами: аналогичные результаты получены на датасетах, связанных с логическим анализом текстов и программированием.

Работа вызвала интерес в сообществе разработчиков ИИ, поскольку решает две критические проблемы современных языковых моделей: высокую стоимость инференса крупных моделей и склонность к галлюцинациям. Сара Го (Sarah Guo), партнёр венчурного фонда Conviction, прокомментировала: «Это не просто оптимизация — это сдвиг парадигмы в том, как мы думаем о масштабировании разума». В то же время авторы признают, что метод требует доступа к трассировкам рассуждений исходной модели, что может ограничивать его применимость для закрытых коммерческих систем.

Технический отчёт с описанием методики и результатами экспериментов опубликован в репозитории проекта на платформе GitHub. Исследователи также выложили веса обученной модели Qwen3-4B для свободного использования.

Источники: X-пост Лун Вана (Lun Wang), 3 июля 2026; технический отчёт на GitHub.
