Аспирантка Вашингтонского университета Вейцзя Ши (Weijia Shi) успешно защитила докторскую диссертацию, посвящённую методам разложения больших языковых моделей (LLM) на более простые компоненты. Работа вызвала широкий интерес в научном сообществе, собрав десятки тысяч просмотров в социальных сетях.
Защита диссертации Вейцзя Ши состоялась 28 июня 2026 года и стала заметным событием в области исследований искусственного интеллекта. Основное внимание в работе уделено подходу к декомпозиции LLM — процессу, позволяющему выделять из сложных моделей отдельные функциональные блоки, отвечающие за конкретные задачи, такие как обработка естественного языка или логический вывод.
По словам коллег Ши, представленная методология может способствовать повышению прозрачности и управляемости моделей, а также снижению вычислительных затрат на их обучение и эксплуатацию. В частности, научный руководитель Ши, профессор Вашингтонского университета Тао Юй (Tao Yu), отметил, что работа открывает новые возможности для интерпретируемости ИИ-систем. «Предложенные подходы позволяют не только анализировать, но и целенаправленно модифицировать поведение моделей», — заявил он в комментарии на платформе X.
Диссертация Ши уже получила высокую оценку от экспертов в области машинного обучения. Так, исследователь из Google DeepMind Флориан Бранд (Florian Brand) назвал работу «важным шагом на пути к созданию более предсказуемых и контролируемых систем ИИ». В свою очередь, аспирант Миманса Джайсвал (Mimansa Jaiswal) из Стэнфордского университета подчеркнула, что результаты исследования могут быть применены для оптимизации работы моделей в условиях ограниченных ресурсов.
Полный текст диссертации и связанные материалы доступны в репозитории Вашингтонского университета.