Компания OpenAI выпустила новый набор тестов LifeSciBench, включающий 750 задач, разработанных экспертами для оценки возможностей искусственного интеллекта в области наук о жизни. Инструмент призван ускорить внедрение ИИ в фармацевтику и биотехнологии.
OpenAI расширяет применение своих моделей в научной сфере, выпустив специализированный бенчмарк LifeSciBench. Набор тестов охватывает 750 задач, созданных при участии специалистов в области биомедицины, и предназначен для оценки точности, скорости и глубины анализа ИИ-систем в реальных исследовательских сценариях.
В отличие от универсальных бенчмарков, LifeSciBench фокусируется на узкоспециализированных задачах: от интерпретации данных масс-спектрометрии до прогнозирования пространственной структуры белков и анализа клинических протоколов. Как отметил в своём посте старший научный сотрудник Google DeepMind Каран Сингхал (Karan Singhal), «этот инструмент закрывает критический пробел между академическими тестами и потребностями индустрии».
Разработчики подчёркивают, что LifeSciBench не ограничивается оценкой существующих моделей, но и задаёт ориентиры для будущих разработок. В частности, бенчмарк включает задачи, требующие мультимодального анализа — например, сопоставления геномных данных с медицинскими изображениями. Это соответствует тренду на интеграцию ИИ в сквозные исследовательские процессы, от гипотезы до клинических испытаний.
Инструмент уже доступен в открытом доступе на платформе GitHub. OpenAI планирует регулярно обновлять набор задач с учётом обратной связи от научного сообщества и фармацевтических компаний. Ранее компания анонсировала партнёрство с биотех-стартапами для тестирования моделей в реальных исследовательских проектах.
Источники: X-пост Карана Сингхала, 17 июня 2026; блог OpenAI.