Новости 01:37, 17 июня 2026

Исследователи Redwood Research опровергли тезис о невозможности дистилляции моделей через API

Специалисты лаборатории Redwood Research Райан Гринблатт (Ryan Greenblatt) и Натан Ламберт (Nathan Lambert) оспорили утверждение разработчика Сальваторе Санфилиппо (Salvatore Sanfilippo) о принципиальной невозможности дистилляции языковых моделей с использованием API сторонних сервисов.

В центре дискуссии оказался метод дистилляции моделей — процесса, при котором компактная модель обучается на выходах более крупной системы. Санфилиппо, известный как создатель базы данных Redis, ранее утверждал, что API-запросы к закрытым моделям (например, через платные сервисы) не позволяют эффективно воспроизводить их поведение из-за ограничений доступа к внутренним состояниям и архитектуре.

Гринблатт и Ламберт, сотрудники некоммерческой исследовательской организации Redwood Research, опубликовали развёрнутый ответ, в котором привели контрпримеры успешной дистилляции через API. По их словам, ключевым фактором является не столько доступ к «сырым» данным модели, сколько грамотный подбор обучающего распределения и стратегии оптимизации. «Даже при ограниченном API можно добиться высокой точности воспроизведения, если правильно сконструировать набор запросов», — отметил Гринблатт в своём посте.

Авторы подчеркнули, что дистилляция через API уже применяется на практике, в том числе для создания специализированных моделей с меньшими вычислительными затратами. При этом они признали, что метод имеет ограничения: например, сложно воспроизвести поведение модели в редких или нестандартных сценариях. В качестве доказательства работоспособности подхода Ламберт сослался на недавние эксперименты Redwood Research, результаты которых планируется опубликовать в отдельном техническом отчёте.

Дискуссия отражает более широкий спор о возможностях и границах использования закрытых моделей для разработки открытых аналогов. Сторонники API-дистилляции утверждают, что она снижает порог входа для исследователей, не имеющих доступа к мощным вычислительным ресурсам. Критики, в свою очередь, указывают на риски нарушения лицензионных соглашений и потенциального ухудшения качества конечных моделей.

Источники: X-пост Райана Гринблатта (Ryan Greenblatt), 15 июня 2026; X-пост Натана Ламберта (Nathan Lambert), 15 июня 2026.

Еще новости

Илон Маск представил нейросеть xAI для анализа спутниковых данных SpaceX

Microsoft наняла исследователя Finbarr Timbers для работы над посттренировочными технологиями ИИ

Anthropic обогнала OpenAI в рейтинге языковых моделей по версии Epoch AI