Компании Google DeepMind, OpenAI и Anthropic инвестируют от $10 млрд до $15 млрд в обучение передовых моделей искусственного интеллекта, так как стоимость высококачественных обучающих задач выросла до $20 тыс. за единицу. Об этом свидетельствуют данные, опубликованные аналитиками и исследователями в социальной сети X.
Рост затрат на обучение моделей ИИ связан с дефицитом качественных данных и усложнением задач для разметки. По оценкам экспертов, стоимость одной высококачественной обучающей задачи — например, аннотирования сложных текстов или генерации специализированных датасетов — достигла $20 тыс. Это в десятки раз превышает расценки на стандартные задачи по разметке данных, которые ранее использовались для обучения моделей.
Основные игроки рынка — Google DeepMind, OpenAI и Anthropic — вынуждены масштабировать инвестиции в инфраструктуру и данные, чтобы поддерживать конкурентоспособность своих моделей. Как отметил исследователь Кэмерон Вулф (Cameron R. Wolfe), директор по ИИ-исследованиям в компании *****, «стоимость обучения фронтирных моделей растёт экспоненциально, и это ограничивает круг участников, способных конкурировать на этом уровне».
Помимо прямых затрат на данные, компании сталкиваются с необходимостью привлечения высококвалифицированных специалистов для подготовки и разметки датасетов. Это увеличивает операционные расходы и замедляет темпы разработки новых моделей. По словам аналитика Сэмюэла Хэммонда (Samuel Hammond), сотрудника Фонда экономических исследований Нисканена, «рынок данных для ИИ превращается в олигополию, где доступ к качественным ресурсам определяет лидеров отрасли».
Ранее в отрасли обсуждались альтернативные подходы к снижению затрат, включая синтетические данные и автоматизированную разметку. Однако, как подчёркивают эксперты, эти методы пока не способны полностью заменить ручную работу экспертов в критически важных областях, таких как медицина или юриспруденция.