Исследователи Microsoft Research опубликовали метод SkillOpt, который позволяет оптимизировать навыки искусственных агентов, рассматривая их как обучаемые внешние состояния «замороженных» моделей. Работа, представленная 25 мая 2026 года, демонстрирует преимущества подхода перед ручным написанием инструкций и альтернативными методами.
Исследовательская группа Microsoft Research под руководством Омара Сара (Omar Sar) разработала метод оптимизации навыков ИИ-агентов SkillOpt, который не требует изменения базовой модели. Вместо этого алгоритм корректирует внешние инструкции — так называемые «скилл-доки» — с помощью отдельной оптимизирующей модели, которая вносит правки на основе валидационных данных.
SkillOpt использует «текстуальный шаг обучения» (textual learning rate), регулирующий агрессивность изменений: система может добавлять, удалять или заменять инструкции в документе с навыками. При этом сама модель агента остаётся неизменной, что исключает дополнительные затраты на инференс. По данным исследования, метод показал лучшие или сопоставимые результаты во всех 52 тестовых сценариях, охватывающих различные комбинации моделей, бенчмарков и фреймворков.
На модели GPT-5.5 SkillOpt обеспечил прирост производительности на 23,5 пункта в режиме прямого чата, на 24,8 пункта при использовании Codex и на 19,1 пункта с Claude Code по сравнению с базовыми настройками без оптимизированных навыков. Метод превзошёл как ручное написание инструкций, так и альтернативные подходы, включая TextGrad, GEPA и EvoSkill. Кроме того, оптимизированные навыки продемонстрировали способность к переносу между различными моделями и фреймворками.
«Это показывает, почему ручное написание скилл-доков не оптимально», — отметил Омар Сар в своём посте. Исследование также привлекло внимание сооснователя стартапа GBrain Гарри Тана (Garry Tan), который сообщил о планах внедрить аналогичные концепции в свою платформу на текущей неделе.
Работа опубликована на платформе arXiv и доступна для ознакомления. Дополнительные материалы по созданию эффективных ИИ-агентов представлены в образовательном проекте DAIR Academy.
Источники: X-пост Омара Сара, 25 мая 2026; X-пост Гарри Тана, 26 мая 2026; препринт на arXiv.