Научный руководитель Microsoft по ИИ Нанду де Фрейтас (Nando de Freitas) опубликовал тезис о новом подходе к обучению роботов: прогнозирование следующего сенсорного сигнала заставляет системы формировать внутренние физические модели без использования камер.
Нанду де Фрейтас, возглавляющий направление искусственного интеллекта в Microsoft, выдвинул гипотезу о том, что роботы могут самостоятельно строить абстрактные представления о физическом мире, если их обучать предсказывать следующий сенсорный сигнал. По его словам, такой метод позволяет обойтись без традиционного компьютерного зрения, полагаясь вместо этого на данные с тактильных датчиков, акселерометров и других сенсоров.
В основе подхода лежит идея, что предсказание будущих состояний заставляет модель формировать «латентные» (скрытые) представления о законах физики — например, о массе, инерции или трении. Де Фрейтас сравнил это с тем, как человек, не глядя на предмет, может интуитивно оценить его вес или форму, основываясь на тактильных ощущениях. «Система вынуждена строить внутреннюю модель мира, чтобы минимизировать ошибку предсказания», — написал он в посте.
Тезис де Фрейтаса вызвал дискуссию среди специалистов по робототехнике. Профессор Калифорнийского университета в Беркли Джитендра Малик (Jitendra Malik) отметил, что подход напоминает ранние работы по обучению с подкреплением, где агенты также формировали внутренние модели среды. Однако, по его словам, остаётся открытым вопрос, насколько такие представления будут универсальными и применимыми к новым задачам.
Ранее де Фрейтас публиковал работы по обучению роботов через взаимодействие с окружающей средой, в том числе в рамках проектов Microsoft по автономным системам. Подход, описанный в его последнем посте, пока не реализован в виде работающей модели, но может стать основой для будущих экспериментов.
Источники: X-пост Нанду де Фрейтаса (Nando de Freitas), 27 июня 2026 года.