# Бывший ведущий разработчик xAI сравнил современные ИИ-видеогенераторы с первыми автодополнениями

> Этан Хе (Ethan He), ранее возглавлявший направление world model в xAI, опубликовал в X прогноз о том, что большие языковые модели (LLM) вскоре смогут управлять интерактивными видеосредами.

- Canonical HTML: https://youragents.me/ru/media/news/byvshij-vedushhij-razrabotchik-xai-sravnil-sovremennye-ii-videogeneratory-s-pervymi-avtodopolnenijami
- Markdown: https://youragents.me/ru/media/news/byvshij-vedushhij-razrabotchik-xai-sravnil-sovremennye-ii-videogeneratory-s-pervymi-avtodopolnenijami.md
- Section: Новости
- Published: 2026-06-02T18:37:38+03:00
- Modified: 2026-06-02T18:37:38+03:00

Этан Хе (Ethan He), ранее возглавлявший направление world model в xAI, опубликовал в X прогноз о том, что большие языковые модели (LLM) вскоре смогут управлять интерактивными видеосредами. По его словам, текущие достижения в генерации видео — лишь начальный этап развития технологии. 

Этан Хе, покинувший xAI в мае 2026 года, утверждает, что современные системы генерации видео, такие как Sora от OpenAI или Veo от Google DeepMind, находятся на уровне развития, сопоставимом с первыми инструментами автодополнения текста. В своём посте он отметил, что нынешние модели способны создавать лишь статичные или слабо интерактивные видеоролики, тогда как следующая фаза развития предполагает переход к полноценным интерактивным средам, управляемым языковыми моделями.

По мнению Хе, ключевым шагом станет интеграция LLM с трёхмерными движками и физическими симуляторами, что позволит моделям не только генерировать видео, но и динамически реагировать на действия пользователя в реальном времени. «Сейчас мы видим лишь верхушку айсберга — как когда-то автодополнение казалось революцией, а теперь это базовая функция любого текстового редактора», — написал он. Хе также предположил, что переход к интерактивным видеосредам произойдёт в течение ближайших 2–3 лет, при условии сохранения текущих темпов развития вычислительных мощностей.

В обсуждении поста приняли участие другие исследователи в области ИИ. Зайн Шах (Zain Shah), инженер-исследователь из Stability AI, согласился с оценкой Хе, добавив, что основным ограничением остаётся нехватка данных для обучения моделей на интерактивных сценариях. «Проблема не в архитектуре, а в данных: у нас есть миллиарды статичных изображений, но почти нет датасетов, где объекты взаимодействуют по законам физики», — отметил Шах.

Хе не раскрыл подробностей о причинах своего ухода из xAI, однако его прогнозы совпадают с трендами, которые наблюдаются в индустрии. Ранее в 2026 году компании Anthropic и Google DeepMind представили прототипы моделей, способных генерировать короткие интерактивные сцены, но их коммерческое применение пока ограничено.

Источники: X-пост Этана Хе (Ethan He), 1 июня 2026; X-пост Зайна Шаха (Zain Shah), 1 июня 2026.