Глава Tesla и xAI Илон Маск (Elon Musk) в социальной сети X раскритиковал подход к оценке моделей искусственного интеллекта через стандартные тесты, назвав успешной стратегию Anthropic, ориентированную на коммерческую полезность.
Илон Маск выступил с тезисом о том, что компания Anthropic смогла добиться успеха, сосредоточившись на создании моделей, приносящих реальную выгоду, а не на достижении высоких результатов в академических бенчмарках. По его словам, такой подход позволяет эффективнее масштабировать технологии и быстрее выводить их на рынок.
Маск не привел конкретных примеров, но его заявление прозвучало на фоне растущей критики в адрес традиционных методов оценки ИИ. Многие разработчики отмечают, что бенчмарки часто не отражают реальную производительность моделей в прикладных задачах, таких как генерация кода, работа с большими объемами данных или взаимодействие с пользователями. В то же время компании вроде Anthropic и OpenAI активно внедряют свои модели в коммерческие продукты, что позволяет им получать обратную связь непосредственно от бизнеса.
«Если модель решает реальные задачи и приносит доход, это важнее, чем лидерство в таблицах лидеров», — написал Маск в ответ на пост одного из пользователей X. Он также подчеркнул, что такой подход требует тесной работы с клиентами и постоянной адаптации технологий под их потребности.
В отрасли реакция на слова Маска разделилась. Часть экспертов согласилась с тем, что бенчмарки устаревают, особенно в условиях быстрого развития генеративного ИИ. Другие, однако, отметили, что без стандартизированных тестов сложно сравнивать модели и отслеживать прогресс в исследованиях. В частности, представители академических кругов продолжают настаивать на необходимости объективных метрик для оценки безопасности и надежности систем.
Источники: X-пост Илона Маска, 18 июня 2026 года.