Новости 19:37, 27 мая 2026

Спор о «стохастических попугаях»: почему прогнозы Тимит Гебру о рисках ИИ сбываются

Бывшая руководительница команды по этике ИИ в Google Тимит Гебру (Timnit Gebru) в 2020 году опубликовала исследование, предупреждавшее о ключевых рисках больших языковых моделей (LLM). Шесть лет спустя её прогнозы подтвердились — от галлюцинаций моделей до усиления предвзятости и экологического ущерба, однако индустрия продолжает игнорировать системные проблемы.

В декабре 2020 года Google уволила Тимит Гебру — одну из ведущих исследовательниц в области этики искусственного интеллекта и соавтора статьи «О рисках стохастических попугаев» (On the Dangers of Stochastic Parrots). Поводом стало её отказ отредактировать или отозвать работу, критиковавшую подходы к созданию LLM. Тогда компания утверждала, что Гебру ушла по собственному желанию, однако более 2600 её коллег подписали открытое письмо, подтверждавшее факт увольнения.

Статья, написанная Гебру в соавторстве с лингвисткой Эмили Бендер (Emily Bender) из Вашингтонского университета, предсказала основные проблемы современных языковых моделей за годы до их массового развёртывания. Первым тезисом стало отсутствие у LLM понимания языка: модели лишь воспроизводят статистические закономерности из обучающих данных, не осознавая смысла. Этот эффект, названный «стохастическими попугаями», привёл к феномену галлюцинаций — генерации ложной информации с высокой уверенностью. В 2020 году, когда вышла GPT-3, термина для этого явления ещё не существовало.

Вторым ключевым риском авторы назвали усиление предвзятости. Тренировочные данные, собранные из интернета, содержат перекос в пользу доминирующих групп, а оптимизация моделей на уверенность в ответах лишь усугубляет дискриминацию. Прогнозы сбылись: алгоритмы найма Amazon дискриминировали резюме с упоминанием слова «женщины», медицинские системы недооценивали потребности чернокожих пациентов, а кредитные алгоритмы Apple выдавали супругам разные лимиты при идентичных финансовых показателях.

Третьим пунктом статья поднимала экологические издержки. По расчётам Гебру и Бендер, обучение одной крупной модели эквивалентно выбросам пяти автомобилей за весь срок службы. К 2024 году выбросы Google выросли на 48% по сравнению с 2019 годом, а Microsoft — на 29%, причём обе компании прямо связывали рост с развитием ИИ-инфраструктуры. При этом корпорации свернули публичные климатические обязательства, действовавшие на момент увольнения Гебру.

Четвёртый риск касался непрозрачности данных. Авторы предупреждали, что объёмы обучающих выборок делают их аудит невозможным. В 2023 году выяснилось, что датасет LAION-5B, использованный для обучения Stable Diffusion и других моделей, содержал тысячи изображений с детской порнографией. Компании, тренировавшие на нём модели, не могли этого знать — прогноз Гебру сбылся за три года до инцидента.

Наконец, статья предсказала централизацию лингвистической власти в руках нескольких корпораций. Сегодня 57% нового контента в английском сегменте интернета генерируется или редактируется ИИ, что ухудшает качество данных для низкоресурсных языков. Исследования фиксируют деградацию переводов для таких языков, так как синтетический контент, попадая в новые обучающие выборки, усиливает ошибки.

«Каждая из этих проблем — не случайность, а следствие структурных стимулов», — подчёркивала Гебру. Индустрия вознаграждает скорость разработки, а не безопасность, и критики внутри компаний либо игнорируются, либо увольняются. После увольнения Гебру Google распустил команду по этике ИИ за 90 дней, а её коллега Маргарет Митчелл (Margaret Mitchell) была уволена за попытку собрать доказательства несправедливого отношения к Гебру.

Сегодня Гебру возглавляет Distributed AI Research Institute (DAIR) — независимый исследовательский центр, работающий вне контроля технологических гигантов. Её прогнозы подтвердились, но реакция индустрии осталась прежней: Google, второй по величине разработчик LLM, продолжает внедрять технологии, о рисках которых предупреждала Гебру. При этом, как отмечают эксперты, число исследователей, готовых публично критиковать безопасность ИИ, резко сократилось после 2020 года.

Источники: X-пост Серхио (Sergio), 26 мая 2026 года.

Еще новости

Исследователи представили модель EPICURE, сжимающую 4,1 млн рецептов в 2 МБ

Xiaomi снизила цены на API моделей MiMo-V2.5 до 99% при кэш-попаданиях

PrismML выпустила 1-битную диффузионную модель для генерации изображений на смартфонах