Бывший руководитель отдела коммуникаций OpenAI Логан Килпатрик (Logan Kilpatrick) выступил с идеей венчурного подхода, основанного исключительно на оценке производительности моделей искусственного интеллекта по стандартным тестам.
Логан Килпатрик, покинувший OpenAI в мае 2026 года, опубликовал в социальной сети X концепцию инвестиционной стратегии, которая предполагает отбор стартапов для финансирования на основе объективных бенчмарков — наборов тестов, измеряющих качество работы ИИ-моделей. По его словам, такой подход позволит снизить влияние субъективных факторов, таких как репутация основателей или маркетинговые обещания, на решения инвесторов.
Килпатрик подчеркнул, что современные бенчмарки, такие как MMLU, HumanEval и GSM8K, уже способны давать достаточно точную картину возможностей моделей. «Если модель показывает лучшие результаты в ключевых тестах, это надёжный индикатор её потенциала», — написал он. При этом он отметил, что бенчмарки должны регулярно обновляться, чтобы соответствовать развитию технологий и не становиться уязвимыми для «переобучения» моделей под конкретные тесты.
Идея вызвала дискуссию среди специалистов. Сооснователь Stability AI Эмад Мостаке (Emad Mostaque) поддержал подход, назвав его «логичным шагом к более прозрачному инвестированию». В то же время исследователь из Meta Алекс Пейсаховіч (Alex Peysakhovich) усомнился в универсальности бенчмарков, указав, что они не всегда отражают реальную применимость моделей в бизнес-задачах.
Килпатрик не раскрыл деталей возможной реализации своей идеи, но предположил, что венчурные фонды могли бы интегрировать автоматизированные системы оценки моделей в свои процессы отбора проектов. Ранее он работал над развитием экосистемы разработчиков в OpenAI, а после ухода из компании заявил о планах заняться независимыми проектами в сфере ИИ.
Источники: X-пост Логана Килпатрика, 6 июня 2026; комментарии Эмада Мостаке и Алекса Пейсаховича.