Новости 04:00, 4 июля 2026
Поделиться

Anthropic зафиксировала утечку внутреннего «потока мыслей» модели Claude во время программирования

Исследователи и пользователи X обнаружили, что языковая модель Anthropic Claude при выполнении программистских задач использует сжатый промежуточный язык для внутренних рассуждений, фрагменты которого попали в открытый доступ. Инцидент произошел 2 июля 2026 года.

В сети появились свидетельства того, что модель Claude, разработанная компанией Anthropic, при решении задач по программированию генерирует внутренний «поток мыслей» (chain of thought) на специальном сжатом языке. Утечка произошла, когда пользователи заметили в ответах модели необработанные промежуточные выкладки, которые не были предназначены для внешнего отображения.

Как пишет исследователь под ником Teortaxes (X-аккаунт @teortaxesTex), связанный с китайской компанией DeepSeek, обнаруженный язык представляет собой «крайне лаконичный синтаксис», напоминающий псевдокод или внутренний формат представления алгоритмов. В частности, в утекших фрагментах встречались сокращенные обозначения переменных, условных операторов и циклов, а также комментарии, не предназначенные для конечного пользователя. «Это не баг, а особенность работы модели на промежуточных этапах», — отметил он, подчеркнув, что подобные артефакты могут возникать при определенных настройках вывода.

Представители Anthropic пока не прокомментировали инцидент официально, однако в сообществе разработчиков уже обсуждаются возможные последствия. Эксперт по ИИ Боян Тунгуз (Bojan Tunguz) предположил, что утечка может быть связана с экспериментальным режимом работы модели, в котором отключены фильтры постобработки. «Это дает редкую возможность заглянуть под капот, но одновременно повышает риски неконтролируемого вывода служебной информации», — написал он в своем посте.

Интерес к случившемуся проявил и Илон Маск (Elon Musk), который в ответ на публикацию Teortaxes отметил, что «прозрачность внутренних процессов ИИ — ключ к безопасности». В то же время другие участники дискуссии, включая инженера Даниэль Фонг (Danielle Fong), указали на потенциальные риски: если подобные утечки станут регулярными, злоумышленники смогут использовать промежуточные данные для обхода защитных механизмов моделей.

На данный момент неизвестно, была ли утечка разовой или свидетельствует о системной проблеме. В блоге Anthropic ранее упоминалось, что компания тестирует различные подходы к оптимизации генерации кода, включая использование промежуточных языков, однако детали реализации не раскрывались.

Источники: X-пост Teortaxes (2 июля 2026); X-пост Бояна Тунгуза (2 июля 2026); блог Anthropic.