На 79-м году жизни скончался греко-американский математик и инженер Димитрис Берцекас (Dimitri Bertsekas), чьи работы легли в основу современных методов оптимизации, теории управления и обучения с подкреплением. О смерти учёного сообщили его коллеги и ученики в социальной сети X.
Димитрис Берцекас — профессор Массачусетского технологического института (MIT) и Аризонского университета, автор более 20 монографий и сотен научных статей — считается одним из ключевых теоретиков в области выпуклой оптимизации и динамического программирования. Его учебники, в частности «Dynamic Programming and Optimal Control» и «Convex Optimization Algorithms», стали классическими и используются в ведущих университетах мира.
Берцекас стоял у истоков развития методов обучения с подкреплением (reinforcement learning, RL), которые сегодня применяются в робототехнике, финансах и системах искусственного интеллекта. Его работы по стохастической оптимизации и приближённому динамическому программированию заложили математический фундамент для алгоритмов, используемых в современных RL-моделях, включая те, что лежат в основе генеративных систем.
«Он был не только блестящим учёным, но и наставником для нескольких поколений исследователей. Его книги учили думать строго, но творчески», — написал в X профессор Принстонского университета Менгди Ван (Mengdi Wang), бывший студент Берцекаса.
Коллеги отмечают, что Берцекас до последних лет сохранял научную активность: в 2023 году он опубликовал монографию «Lessons from AlphaZero for Optimal, Model Predictive, and Adaptive Control», где анализировал связь между методами оптимального управления и достижениями в области ИИ, такими как алгоритм AlphaZero от DeepMind.
Димитрис Берцекас родился в Греции в 1946 году, окончил Афинский национальный технический университет, а затем получил степень доктора наук в MIT. В 1979 году он присоединился к факультету электротехники и компьютерных наук MIT, где проработал более трёх десятилетий, прежде чем перейти в Аризонский университет. Среди его наград — премия Ричарда Беллмана от Американского общества автоматического управления (AACC) и премия Джона фон Неймана от Института исследования операций и управления (INFORMS).