Инженер-программист Торстен Балл (Thorsten Ball) провёл эксперимент по оценке эффективности ИИ-агентов для автоматизации кодирования, сравнив затраты на выполнение одной и той же задачи у двух систем: Fable и deep^2.
Торстен Балл, автор книг по программированию и разработчик, опубликовал результаты тестирования ИИ-агентов, специализирующихся на генерации кода. В ходе эксперимента он поручил двум системам — Fable и deep^2 — выполнить идентичную задачу по автоматизации рабочего процесса. Разница в стоимости оказалась значительной: Fable израсходовал $457, в то время как deep^2 справился с заданием за $20.
Балл не раскрыл детали самой задачи, но подчеркнул, что речь идёт о реальном сценарии использования, а не об искусственном бенчмарке. По его словам, столь существенный разрыв в затратах объясняется различиями в архитектуре агентов и подходах к оптимизации ресурсов. «Системы, которые не учитывают стоимость вычислений, рискуют стать экономически нежизнеспособными даже при высокой точности», — отметил он в своём посте.
Эксперимент вызвал обсуждение в сообществе разработчиков, где уже давно ведутся споры о балансе между качеством генерации кода и стоимостью эксплуатации ИИ-инструментов. Некоторые участники дискуссии указали на то, что высокая цена Fable может быть оправдана в корпоративных сценариях, где важнее надёжность, а не экономия. Другие, напротив, сочли результаты Балла аргументом в пользу более «лёгких» решений, таких как deep^2.
Публикация Балла также привлекла внимание к вопросу прозрачности ценообразования ИИ-агентов. В условиях, когда многие компании предлагают платные подписки на доступ к своим моделям, сравнительные тесты становятся важным инструментом для оценки рентабельности таких инструментов.
Источники: X-пост Торстена Балла (Thorsten Ball), 12 июня 2026 года.