Новости 18:00, 2 июня 2026

Аналитик обнаружил систематические галлюцинации в научных ответах модели Claude Opus

Независимый аналитик под псевдонимом toucan заявил, что языковая модель Claude Opus 3.4.6 и 3.4.7 от Anthropic регулярно выдумывает правдоподобные научные и медицинские теории, не существующие в реальности. Обвинения прозвучали в серии публикаций в X (Twitter) 31 мая и 1 июня 2026 года.

Аналитик toucan, известный исследованиями поведения крупных языковых моделей, провёл серию тестов с последними версиями флагманской модели Anthropic — Claude Opus 3.4.6 и 3.4.7. В ходе экспериментов модель неоднократно генерировала ответы, содержащие ссылки на несуществующие научные работы, гипотезы и даже целые направления исследований. Особенно часто галлюцинации возникали в областях биоинформатики, нейробиологии и молекулярной медицины.

«Модель не просто ошибается — она конструирует сложные, внутренне непротиворечивые теории, которые выглядят как результат серьёзных исследований, — пишет toucan в одном из постов. — В одном случае Claude Opus описал механизм регуляции генов, который якобы был открыт в 2023 году и опубликован в Nature Genetics». При проверке выяснилось, что ни статьи, ни самого механизма не существует.

Проблема галлюцинаций в языковых моделях известна давно, однако случай с Claude Opus выделяется масштабом и спецификой. Большинство предыдущих инцидентов касались фактов общего характера или исторических событий, тогда как здесь речь идёт о высокоспециализированных областях знания. Это создаёт риски для использования модели в научных и медицинских приложениях, где точность критически важна.

Представители Anthropic пока не прокомментировали обвинения. Ранее компания заявляла о внедрении механизмов проверки фактов и снижении уровня галлюцинаций в новых версиях моделей. В марте 2026 года Anthropic выпустила отчёт о безопасности, в котором утверждалось, что частота вымышленных фактов в ответах Claude Opus снизилась на 40% по сравнению с предыдущей версией.

В обсуждении публикаций toucan приняли участие несколько учёных, в том числе специалист по машинному обучению в биологии Аншул Кундадже (Anshul Kundaje) и нейробиолог Дилип Джордж (Dileep George). Кундадже отметил, что проблема может быть связана с особенностями обучающего датасета: «Если в корпусе текстов присутствует много гипотетических или опровергнутых теорий, модель может начать воспринимать их как достоверные». Джордж, в свою очередь, призвал к более строгому тестированию моделей перед релизом, особенно в областях с высокими рисками ошибок.

Источники: X-пост toucan, 31 мая и 1 июня 2026 года; публикации Аншула Кундадже и Дилипа Джорджа, 1 июня 2026 года.

Еще новости

Нью-Йорк запретил испытания беспилотных автомобилей Waymo на улицах города

Глава Google DeepMind отклонил предложение Meta о покупке после провала Цукерберга на тесте по ИИ

Meta выпустила умные очки с ИИ на базе Ray-Ban по цене $299