Сооснователь и генеральный директор Runway Сици Чен (Siqi Chen) сообщил, что промежуточная версия модели «5.5» на архитектуре «codex xhigh» демонстрирует значительное превосходство над Claude в задачах программирования. Заявление сделано в социальной сети X без публикации подробных бенчмарков.
Сици Чен, возглавляющий стартап Runway, специализирующийся на генеративных моделях для видео и мультимедиа, опубликовал пост, в котором утверждает о прорыве в области генерации кода. По его словам, модель «5.5» на базе архитектуры «codex xhigh» показывает результаты, превосходящие аналогичные решения от Anthropic, включая флагманскую модель Claude.
Чен не раскрыл технические детали архитектуры «codex xhigh», однако подчеркнул, что речь идёт о промежуточном релизе, а не о финальной версии. В посте также не приведены конкретные метрики или сравнительные тесты, которые подтверждали бы заявленное преимущество. В комментариях к публикации другие разработчики и исследователи в области ИИ отметили, что без независимой верификации результатов утверждения остаются неподтверждёнными.
Runway, известный прежде всего инструментами для создания и редактирования видео с помощью ИИ, ранее не позиционировался как игрок на рынке моделей для программирования. Заявление Чена может указывать на расширение сферы интересов компании или тестирование новых архитектурных подходов, применимых за пределами мультимедийных задач.
В отрасли подобные анонсы часто сопровождаются публикацией технических отчётов или открытых бенчмарков, однако на момент публикации поста таких материалов представлено не было. Представители Anthropic пока не прокомментировали заявление Чена.