Новости 20:37, 7 июня 2026

Экс-глава коммуникаций OpenAI предложил инвестировать в ИИ-стартапы по результатам бенчмарков

Бывший руководитель отдела коммуникаций OpenAI Логан Килпатрик (Logan Kilpatrick) выступил с идеей венчурного подхода, основанного исключительно на оценке производительности моделей искусственного интеллекта по стандартным тестам.

Логан Килпатрик, покинувший OpenAI в мае 2026 года, опубликовал в социальной сети X концепцию инвестиционной стратегии, которая предполагает отбор стартапов для финансирования на основе объективных бенчмарков — наборов тестов, измеряющих качество работы ИИ-моделей. По его словам, такой подход позволит снизить влияние субъективных факторов, таких как репутация основателей или маркетинговые обещания, на решения инвесторов.

Килпатрик подчеркнул, что современные бенчмарки, такие как MMLU, HumanEval и GSM8K, уже способны давать достаточно точную картину возможностей моделей. «Если модель показывает лучшие результаты в ключевых тестах, это надёжный индикатор её потенциала», — написал он. При этом он отметил, что бенчмарки должны регулярно обновляться, чтобы соответствовать развитию технологий и не становиться уязвимыми для «переобучения» моделей под конкретные тесты.

Идея вызвала дискуссию среди специалистов. Сооснователь Stability AI Эмад Мостаке (Emad Mostaque) поддержал подход, назвав его «логичным шагом к более прозрачному инвестированию». В то же время исследователь из Meta Алекс Пейсаховіч (Alex Peysakhovich) усомнился в универсальности бенчмарков, указав, что они не всегда отражают реальную применимость моделей в бизнес-задачах.

Килпатрик не раскрыл деталей возможной реализации своей идеи, но предположил, что венчурные фонды могли бы интегрировать автоматизированные системы оценки моделей в свои процессы отбора проектов. Ранее он работал над развитием экосистемы разработчиков в OpenAI, а после ухода из компании заявил о планах заняться независимыми проектами в сфере ИИ.

Источники: X-пост Логана Килпатрика, 6 июня 2026; комментарии Эмада Мостаке и Алекса Пейсаховича.

Еще новости

Основатель Late Checkout показал, как запускать локальных ИИ-агентов на базе Hermes Desktop

Инвесторы Андрессен и Байерс защитили стратегию Винода Хослы вложений в OpenAI и deep tech

Исследователи MIT применили теорию категорий для автономного расширения схем научного мышления ИИ