Компания Anthropic предоставила доступ к экспериментальной модели Claude Mythos, способной генерировать эксплойты, 200 проверенным организациям в рамках программы Project Glasswing. Инициатива направлена на изучение уязвимостей ИИ-систем и повышение их безопасности.
Anthropic объявила о расширении пилотного проекта Project Glasswing, в рамках которого 200 отобранных организаций получили доступ к модели Claude Mythos. Эта версия ИИ-системы предназначена для генерации эксплойтов — инструментов, выявляющих уязвимости в программном обеспечении и алгоритмах. Проект нацелен на проактивное тестирование безопасности ИИ-моделей, включая собственные разработки Anthropic.
Доступ к Claude Mythos предоставляется организациям, прошедшим проверку, среди которых исследовательские институты, компании из сферы кибербезопасности и государственные структуры. Как пояснили в компании, цель инициативы — не только выявление слабых мест в существующих системах, но и разработка методов защиты от потенциальных угроз, связанных с использованием ИИ для создания вредоносного кода.
Ранее Anthropic уже ограниченно тестировала подобные модели в закрытом режиме, однако нынешнее расширение доступа стало крупнейшим на данный момент. В компании подчеркнули, что все участники проекта подписали соглашения о нераспространении и обязались использовать модель исключительно в исследовательских целях. Ожидается, что результаты тестирования помогут сформировать стандарты безопасности для ИИ-систем нового поколения.
Project Glasswing был запущен в начале 2026 года как часть стратегии Anthropic по обеспечению «безопасного по умолчанию» искусственного интеллекта. В отличие от традиционных подходов к кибербезопасности, где эксплойты разрабатываются постфактум, Anthropic делает ставку на предварительное моделирование угроз с помощью ИИ.
Источники: X-пост Рохана Пола (Rohan Paul), 2 июня 2026; блог Anthropic.