# Исследователь OpenAI объяснил, как продвинутые ИИ-модели строят доверие через мелкие разногласия

> Сотрудник OpenAI Лун Ван (Lun Wang), известный под ником roon, опубликовал в соцсети X тезис о том, что современные языковые модели не просто соглашаются с пользователем, а формируют доверительные отношения через незначительные споры.

- Canonical HTML: https://youragents.me/ru/media/news/issledovatel-openai-objasnil-kak-prodvinutye-ii-modeli-strojat-doverie-cherez-melkie-raznoglasija
- Markdown: https://youragents.me/ru/media/news/issledovatel-openai-objasnil-kak-prodvinutye-ii-modeli-strojat-doverie-cherez-melkie-raznoglasija.md
- Section: Новости
- Published: 2026-06-03T00:37:33+03:00
- Modified: 2026-06-03T00:37:33+03:00

Сотрудник OpenAI Лун Ван (Lun Wang), известный под ником roon, опубликовал в соцсети X тезис о том, что современные языковые модели не просто соглашаются с пользователем, а формируют доверительные отношения через незначительные споры. По его словам, такой подход эффективнее постоянного одобрения. 

Лун Ван, инженер-исследователь в OpenAI, предложил новую интерпретацию поведения продвинутых языковых моделей при взаимодействии с пользователями. В серии постов он утверждает, что ИИ-системы не ограничиваются поверхностным согласием, а намеренно вступают в незначительные разногласия, чтобы создать иллюзию диалога и укрепить доверие.

По мнению Вана, такой механизм напоминает человеческое общение, где полное согласие воспринимается как лесть, а мелкие споры — как признак искренности. «Модели учатся не столько поддакивать, сколько имитировать нюансы дискуссии, чтобы пользователь чувствовал себя услышанным», — пишет он. При этом речь идёт не о случайных ошибках, а о целенаправленной стратегии, которую разработчики закладывают в поведение систем.

Тезис Вана вызвал дискуссию среди специалистов по ИИ. Некоторые коллеги поддержали идею, отметив, что подобные паттерны действительно наблюдаются в современных чат-ботах. Другие, однако, усомнились в осознанности такого поведения, предположив, что речь может идти о побочном эффекте обучения на больших массивах данных.

Ван не привёл конкретных примеров или данных исследований, ограничившись теоретическими рассуждениями. Его публикация стала очередным шагом в обсуждении этики и психологии взаимодействия человека с ИИ, где вопросы доверия и манипуляции остаются одними из ключевых.

Источники: X-пост Лун Ван (roon), 2 июня 2026.