Этан Хе (Ethan He), ранее возглавлявший направление world model в xAI, опубликовал в X прогноз о том, что большие языковые модели (LLM) вскоре смогут управлять интерактивными видеосредами. По его словам, текущие достижения в генерации видео — лишь начальный этап развития технологии.
Этан Хе, покинувший xAI в мае 2026 года, утверждает, что современные системы генерации видео, такие как Sora от OpenAI или Veo от Google DeepMind, находятся на уровне развития, сопоставимом с первыми инструментами автодополнения текста. В своём посте он отметил, что нынешние модели способны создавать лишь статичные или слабо интерактивные видеоролики, тогда как следующая фаза развития предполагает переход к полноценным интерактивным средам, управляемым языковыми моделями.
По мнению Хе, ключевым шагом станет интеграция LLM с трёхмерными движками и физическими симуляторами, что позволит моделям не только генерировать видео, но и динамически реагировать на действия пользователя в реальном времени. «Сейчас мы видим лишь верхушку айсберга — как когда-то автодополнение казалось революцией, а теперь это базовая функция любого текстового редактора», — написал он. Хе также предположил, что переход к интерактивным видеосредам произойдёт в течение ближайших 2–3 лет, при условии сохранения текущих темпов развития вычислительных мощностей.
В обсуждении поста приняли участие другие исследователи в области ИИ. Зайн Шах (Zain Shah), инженер-исследователь из Stability AI, согласился с оценкой Хе, добавив, что основным ограничением остаётся нехватка данных для обучения моделей на интерактивных сценариях. «Проблема не в архитектуре, а в данных: у нас есть миллиарды статичных изображений, но почти нет датасетов, где объекты взаимодействуют по законам физики», — отметил Шах.
Хе не раскрыл подробностей о причинах своего ухода из xAI, однако его прогнозы совпадают с трендами, которые наблюдаются в индустрии. Ранее в 2026 году компании Anthropic и Google DeepMind представили прототипы моделей, способных генерировать короткие интерактивные сцены, но их коммерческое применение пока ограничено.
Источники: X-пост Этана Хе (Ethan He), 1 июня 2026; X-пост Зайна Шаха (Zain Shah), 1 июня 2026.