Внутренний документ Google DeepMind, попавший в публичный доступ, фиксирует падение моделей лаборатории на пятое место в отраслевых бенчмарках и растущее недовольство сотрудников. Утечка произошла на фоне усиливающейся конкуренции со стороны OpenAI, Anthropic и стартапов.
По данным утекшего отчёта, модели Google DeepMind впервые за три года опустились на пятое место в ключевых бенчмарках, уступив решениям OpenAI, Anthropic, Mistral AI и даже китайской 01.AI. В документе, который цитируют источники в X (бывший Twitter), отмечается, что отставание особенно заметно в задачах генерации кода и мультимодального понимания — областях, где DeepMind ранее лидировала.
Авторы отчёта связывают снижение позиций с задержками в релизе новых версий моделей и «размыванием приоритетов» после интеграции DeepMind в структуру Google в 2023 году. «Команда столкнулась с бюрократическими барьерами при масштабировании инфраструктуры, — пишет один из сотрудников в анонимном комментарии, приведённом в документе. — В то время как конкуренты наращивают темпы, мы тратим месяцы на согласование изменений в политике безопасности».
В отчёте также упоминается недовольство сотрудников распределением ресурсов: часть исследователей переведена на проекты, не связанные с разработкой моделей, включая оптимизацию рекламных алгоритмов Google. Это вызвало критику со стороны бывших лидеров DeepMind, включая сооснователя лаборатории Демиса Хассабиса (Demis Hassabis), который в недавнем интервью подчёркивал необходимость «сфокусироваться на научном прорыве, а не на краткосрочных метриках».
Падение в рейтингах совпало с анонсом OpenAI новой модели, превосходящей GPT-4 по всем ключевым показателям, и релизом Anthropic семейства моделей Claude 3.5, которые продемонстрировали рекордные результаты в тестах на понимание контекста. Эксперты отмечают, что отставание Google DeepMind может усугубиться, если компания не ускорит цикл обновлений своих моделей.
В Google на утечку не ответили, однако в корпоративном блоге ранее сообщалось о планах по запуску новой архитектуры Gemini в конце 2026 года. По словам представителей компании, текущие бенчмарки не отражают реальную производительность моделей в прикладных задачах, таких как интеграция с поисковыми системами.