Новости 01:00, 10 июня 2026
Поделиться

Anthropic представила модель Claude Fable с рекордным результатом в тесте для старших инженеров

Компания Anthropic выпустила новую языковую модель Claude Fable класса Mythos, которая набрала 91% в бенчмарке Every для оценки навыков старших инженеров-программистов. Об этом сообщили разработчики в социальной сети X.

Anthropic анонсировала Claude Fable — модель, позиционируемую как часть семейства Mythos. По данным компании, она показала результат в 91% в специализированном тесте Every, предназначенном для проверки компетенций инженеров уровня senior. Этот бенчмарк оценивает способность моделей решать задачи, требующие глубокого понимания кода, архитектуры систем и принятия технических решений.

Ранее в индустрии не было публичных примеров моделей, преодолевших отметку в 90% в этом тесте. Представители Anthropic не раскрыли детали архитектуры Claude Fable, но подчеркнули, что модель оптимизирована для работы с техническими текстами и кодом. В компании отметили, что новый продукт может использоваться как для автоматизации рутинных инженерных задач, так и для помощи в разработке сложных систем.

Результат Claude Fable вызвал дискуссию среди специалистов по машинному обучению. Некоторые эксперты, в том числе исследователь Делип Рао (Delip Rao), указали на ограниченность бенчмарков в оценке реальной производительности моделей. «91% — это впечатляюще, но важно понимать, что тесты вроде Every не охватывают весь спектр задач, с которыми сталкиваются инженеры», — написал Рао в своём посте.

Anthropic не раскрыла планы по коммерческому использованию Claude Fable, но ранее компания заявляла о намерении развивать модели для корпоративных клиентов. В блоге Anthropic отмечалось, что новые версии моделей будут интегрироваться с существующими инструментами разработки.

Источники: X-пост Andrew Curran, 9 июня 2026; X-пост Делип Рао (Delip Rao), 9 июня 2026; блог Anthropic.