Американский исследовательский институт Allen Institute for AI (AI2) выпустил открытую модель TMax с 27 млрд параметров, которая по результатам теста Terminal Bench 2.0 сопоставима с системами, превосходящими её по размеру в десятки раз. Об этом сообщили разработчики проекта в социальной сети X.
Институт AI2, специализирующийся на исследованиях в области искусственного интеллекта, анонсировал TMax — терминального агента с открытым исходным кодом. Модель, обученная на 27 млрд параметров, продемонстрировала результаты, сравнимые с системами, чей объём превышает её в 40 раз, на обновлённом бенчмарке Terminal Bench 2.0. Это достижение подчёркивает эффективность архитектуры и подходов к обучению, применённых командой.
TMax позиционируется как инструмент для автоматизации работы с командной строкой, способный выполнять сложные задачи без дополнительных доработок. Разработчики отмечают, что модель оптимизирована для взаимодействия с терминалами Unix-подобных систем и может применяться в сценариях, требующих высокой точности и скорости обработки команд. Проект доступен на платформе Hugging Face, где размещены как сама модель, так и наборы данных для её дообучения.
В числе авторов разработки — исследователи из AI2, включая Ханну Хаджиширзи (Hanna Hajishirzi), директора по направлению NLP в институте, и Луку Солдайни (Luca Soldaini), старшего научного сотрудника. В публикациях на X они подчёркивают, что TMax — это шаг к созданию более доступных и гибких инструментов для разработчиков, особенно в условиях ограниченных вычислительных ресурсов.
Результаты тестирования Terminal Bench 2.0, на который ссылаются авторы, показывают, что TMax превосходит аналогичные модели меньшего размера и конкурирует с коммерческими решениями. При этом модель остаётся открытой, что позволяет сообществу вносить изменения и адаптировать её под специфические задачи.