Компания Anthropic временно отозвала обновлённую версию фреймворка Fable 5 после того, как исследователи обнаружили, что откат одного из защитных механизмов позволил ускорить инференс модели Gemma 4 на WebGPU до трёх раз. Инцидент стал поводом для обсуждения баланса между безопасностью и производительностью в инструментах для развёртывания ИИ.
Исследователи из сообщества машинного обучения обнаружили критический компромисс в последней версии фреймворка Fable 5 от Anthropic. Как сообщил разработчик Виктор Таелин (Victor Taelin), отключение одного из защитных механизмов — так называемого «safeguard rollback» — привело к трёхкратному ускорению инференса модели Gemma 4 при работе на WebGPU. Таелин опубликовал результаты бенчмарков, показав, что после отката защиты скорость генерации токенов выросла с 120 до 360 токенов в секунду на стандартном оборудовании.
Anthropic оперативно отреагировала на публикацию, приостановив распространение Fable 5. В компании не комментировали технические детали инцидента, но подтвердили, что обновление было отозвано «для дополнительной проверки». По словам независимого исследователя Эндрю Каррана (Andrew Curran), проблема может быть связана с конфликтом между оптимизациями WebGPU и механизмами контроля памяти, которые изначально были встроены в фреймворк для предотвращения утечек данных.
Инцидент вызвал дискуссию о приоритетах при разработке инструментов для развёртывания ИИ. Разработчик Пит Скоморох (Pete Skomoroch) отметил, что «производительность и безопасность часто оказываются на разных чашах весов», особенно в условиях растущего спроса на локальное выполнение моделей. При этом часть сообщества выразила опасения, что отключение защитных механизмов может открыть путь для эксплуатации уязвимостей, например, через атаки типа «model poisoning».
Ранее Anthropic позиционировала Fable как фреймворк с усиленными мерами безопасности, ориентированный на корпоративных клиентов. В документации к предыдущим версиям подчёркивалось, что защитные механизмы не должны существенно влиять на производительность. Однако обнаруженный баг ставит под сомнение эту заявленную сбалансированность.