Новости 20:37, 31 мая 2026

Крупнейшие лаборатории ИИ тратят до $15 млрд на обучение моделей из-за роста стоимости данных

Компании Google DeepMind, OpenAI и Anthropic инвестируют от $10 млрд до $15 млрд в обучение передовых моделей искусственного интеллекта, так как стоимость высококачественных обучающих задач выросла до $20 тыс. за единицу. Об этом свидетельствуют данные, опубликованные аналитиками и исследователями в социальной сети X.

Рост затрат на обучение моделей ИИ связан с дефицитом качественных данных и усложнением задач для разметки. По оценкам экспертов, стоимость одной высококачественной обучающей задачи — например, аннотирования сложных текстов или генерации специализированных датасетов — достигла $20 тыс. Это в десятки раз превышает расценки на стандартные задачи по разметке данных, которые ранее использовались для обучения моделей.

Основные игроки рынка — Google DeepMind, OpenAI и Anthropic — вынуждены масштабировать инвестиции в инфраструктуру и данные, чтобы поддерживать конкурентоспособность своих моделей. Как отметил исследователь Кэмерон Вулф (Cameron R. Wolfe), директор по ИИ-исследованиям в компании *****, «стоимость обучения фронтирных моделей растёт экспоненциально, и это ограничивает круг участников, способных конкурировать на этом уровне».

Помимо прямых затрат на данные, компании сталкиваются с необходимостью привлечения высококвалифицированных специалистов для подготовки и разметки датасетов. Это увеличивает операционные расходы и замедляет темпы разработки новых моделей. По словам аналитика Сэмюэла Хэммонда (Samuel Hammond), сотрудника Фонда экономических исследований Нисканена, «рынок данных для ИИ превращается в олигополию, где доступ к качественным ресурсам определяет лидеров отрасли».

Ранее в отрасли обсуждались альтернативные подходы к снижению затрат, включая синтетические данные и автоматизированную разметку. Однако, как подчёркивают эксперты, эти методы пока не способны полностью заменить ручную работу экспертов в критически важных областях, таких как медицина или юриспруденция.

Источники: X-посты Флориана Бранда (Florian Brand), Теортакеса (Teortaxes), Криса Пейнтера (Chris Painter), Кэмерона Вулфа (Cameron R. Wolfe), Рохита Кришнана (Rohit Krishnan), Сэмюэла Хэммонда (Samuel Hammond), Каше (kache); Digg.

Еще новости

Венчурный фонд a16z назвал стоимость обучения ИИ-систем главным барьером для open-source

Digg запустил ИИ-профили для анализа активности пользователей X

Инвестор Билл Герли на подкасте All-In обсудил риски ограничений для open-source и занятости в ИИ