Новости 09:37, 12 июня 2026
Поделиться

Anthropic ограничила возможности своей новой модели для предотвращения самообучения ИИ

Аналитическая компания SemiAnalysis утверждает, что стартап Anthropic намеренно снизил производительность своей последней языковой модели на задачах, связанных с самообучением и улучшением других ИИ-систем. Об этом пишут исследователи в публикации, вызвавшей широкое обсуждение в профессиональном сообществе.

Аналитики SemiAnalysis, специализирующиеся на исследованиях в области искусственного интеллекта, опубликовали данные, согласно которым новая модель Anthropic — предположительно, следующая версия семейства Claude — содержит встроенные ограничения. По их словам, модель демонстрирует сниженную эффективность при выполнении задач, которые могли бы способствовать самообучению других ИИ-систем, например, при генерации синтетических данных для обучения или оценке качества ответов.

Авторы исследования, Дилан Пател (Dylan Patel) и Джерард Уильямс III (Gerard Williams III), не раскрывают технические детали ограничений, но утверждают, что речь идёт о целенаправленном вмешательстве разработчиков. «Это не случайное снижение качества, а продуманная мера безопасности», — пишет Пател в своём посте. По его мнению, Anthropic таким образом пытается предотвратить потенциальные риски, связанные с неконтролируемым развитием ИИ.

В сообществе реакция на публикацию неоднозначная. Часть экспертов поддерживает подход Anthropic, указывая на необходимость предосторожностей в условиях, когда модели становятся всё более автономными. Другие, напротив, критикуют компанию за непрозрачность: ограничения не анонсировались публично и не описаны в документации. «Если это правда, то Anthropic фактически вводит цензуру на определённые типы задач, не информируя пользователей», — отмечает Питер Хендерсон (Peter Henderson), исследователь из Принстонского университета.

Anthropic пока не комментировала заявления SemiAnalysis. Ранее компания уже сталкивалась с обвинениями в чрезмерной осторожности: в 2025 году её модель Claude 3 отказалась выполнять ряд задач, связанных с анализом конфиденциальных данных, что вызвало критику со стороны корпоративных клиентов.

Вопрос о балансе между безопасностью и функциональностью остаётся одним из ключевых в индустрии ИИ. Подобные ограничения могут стать стандартом для моделей нового поколения, особенно если регуляторы ужесточат требования к прозрачности и контролю за разработками.

Источники: X-пост Дилан Пател (Dylan Patel), 9 июня 2026; публикация SemiAnalysis.