Новости 23:00, 6 июня 2026

Умер пионер теории оптимизации и обучения с подкреплением Димитрис Берцекас

На 79-м году жизни скончался греко-американский математик и инженер Димитрис Берцекас (Dimitri Bertsekas), чьи работы легли в основу современных методов оптимизации, теории управления и обучения с подкреплением. О смерти учёного сообщили его коллеги и ученики в социальной сети X.

Димитрис Берцекас — профессор Массачусетского технологического института (MIT) и Аризонского университета, автор более 20 монографий и сотен научных статей — считается одним из ключевых теоретиков в области выпуклой оптимизации и динамического программирования. Его учебники, в частности «Dynamic Programming and Optimal Control» и «Convex Optimization Algorithms», стали классическими и используются в ведущих университетах мира.

Берцекас стоял у истоков развития методов обучения с подкреплением (reinforcement learning, RL), которые сегодня применяются в робототехнике, финансах и системах искусственного интеллекта. Его работы по стохастической оптимизации и приближённому динамическому программированию заложили математический фундамент для алгоритмов, используемых в современных RL-моделях, включая те, что лежат в основе генеративных систем.

«Он был не только блестящим учёным, но и наставником для нескольких поколений исследователей. Его книги учили думать строго, но творчески», — написал в X профессор Принстонского университета Менгди Ван (Mengdi Wang), бывший студент Берцекаса.

Коллеги отмечают, что Берцекас до последних лет сохранял научную активность: в 2023 году он опубликовал монографию «Lessons from AlphaZero for Optimal, Model Predictive, and Adaptive Control», где анализировал связь между методами оптимального управления и достижениями в области ИИ, такими как алгоритм AlphaZero от DeepMind.

Димитрис Берцекас родился в Греции в 1946 году, окончил Афинский национальный технический университет, а затем получил степень доктора наук в MIT. В 1979 году он присоединился к факультету электротехники и компьютерных наук MIT, где проработал более трёх десятилетий, прежде чем перейти в Аризонский университет. Среди его наград — премия Ричарда Беллмана от Американского общества автоматического управления (AACC) и премия Джона фон Неймана от Института исследования операций и управления (INFORMS).

Источники: X-посты Гокула Свами (Gokul Swamy), Менгди Ван (Mengdi Wang), Йи Ма (Yi Ma), Суббарао Камбхампати (Subbarao Kambhampati), Амир-Масуд Фарахманд (Amir-massoud Farahmand), Чаба Сепешвари (Csaba Szepesvari), Франк Нильсен (Frank Nielsen); публикации на платформе Digg.

Еще новости

Anysphere представила голосовое и жестовое управление интерфейсом Cursor

Anthropic временно увеличила лимиты использования Claude для сложных задач

Y Combinator представил Paxel для анализа сессий программирования с использованием ИИ