Том Макграт (Tom McGrath), сооснователь стартапа Goodfire, анонсировал метод предиктивной отладки данных, позволяющий анализировать датасеты для алгоритма DPO до начала тренировки моделей. Инструмент направлен на выявление потенциальных ошибок и смещений в обучающих выборках.
Том Макграт, ранее работавший в Google DeepMind и Anthropic, представил новый подход к подготовке данных для обучения языковых моделей. Инструмент, разработанный в рамках проекта Goodfire, позволяет оценивать качество датасетов, используемых в алгоритме Direct Preference Optimization (DPO), ещё до запуска тренировочного процесса.
По словам Макграта, традиционные методы отладки данных часто ограничиваются постфактум-анализом — когда модель уже обучена и проявляет нежелательные свойства. Новый подход предполагает предиктивную проверку: инструмент моделирует поведение будущей модели на основе исходных данных и выявляет потенциальные проблемы, такие как несбалансированность выборок или противоречивые примеры.
Метод основан на статистическом анализе и симуляции обучения. Как отметил Макграт в своём блоге, инструмент уже использовался для оптимизации датасетов в нескольких исследовательских проектах, однако подробности о результатах и масштабах применения не раскрываются. Технические детали подхода опубликованы в сопроводительной документации на GitHub.
Разработка Goodfire может стать важным шагом в повышении прозрачности и контроля над процессом обучения ИИ-моделей. В условиях, когда качество данных напрямую влияет на поведение и безопасность систем, предиктивная отладка способна сократить время на доработку моделей и снизить риски некорректных выводов.
Источники: X-пост Тома Макграта (Tom McGrath), 11 июня 2026; блог Goodfire.