Новости 14:32, 21 апреля 2026 Обновлено: 20 апреля 2026
Поделиться

Стартапы начали распродавать архивы Slack, Jira и почты как сырьё для обучения ИИ

Стартапы начали распродавать архивы Slack, Jira и почты как сырьё для обучения ИИ

После закрытия компаний их внутренние переписки, тикеты и рабочие документы неожиданно превратились в ценный актив. ИИ-лаборатории всё чаще покупают такой «цифровой след» как редкий источник данных для обучения агентных моделей, которые должны не просто отвечать на вопросы, а работать как сотрудники.

Когда раньше стартап закрывался, его активами обычно считались код, бренд, клиенты или патенты. Теперь к этому списку добавился ещё один пункт: многолетние архивы переписок, задач и документов. Всё то, что остаётся после ежедневной работы команды — обсуждения в Slack, письма, комментарии в Jira, файлы в Google Drive, — начали продавать как обучающие данные для ИИ.

Именно так, например, произошло с компанией cielo24. Во время закрытия её бывший гендиректор Шанна Джонсон обнаружила, что 13 лет корпоративной истории — от рабочих писем до внутренних шуток в Slack — можно продать за «сотни тысяч долларов». По её словам, эти деньги помогли аккуратно завершить ликвидацию бизнеса и покрыть расходы.

Почему это вообще кому-то нужно? Потому что обычный интернет для обучения ИИ уже не даёт того, что сейчас ищут разработчики. Публичные тексты хорошо подходят для общих языковых моделей, но плохо учат ИИ действовать в рабочих процессах. А вот внутренняя жизнь компаний — это уже готовые примеры того, как люди координируют задачи, спорят, ошибаются, принимают решения и доводят проекты до конца. Для агентного ИИ, который должен вести календарь, писать письма, разруливать задачи и работать с офисным хаосом, такие данные особенно ценны.

На этом фоне начал формироваться целый новый рынок. Компании вроде SimpleClosure и Sunset, которые помогают стартапам закрываться, теперь не просто оформляют ликвидацию, но и продают их «цифровые остатки» ИИ-компаниям. По словам участников рынка, спрос на такие данные огромный, а цены зависят от размера компании, возраста архива и того, насколько хорошо данные связаны между собой. Например, тикет в Jira, который можно привязать к конкретному коммиту и обсуждению в почте, стоит дороже, чем просто одинокий документ без контекста.

Следом вырос и другой сегмент — так называемые RL gyms, или тренировочные площадки для ИИ-агентов. Их создатели используют архивы закрывшихся компаний, чтобы строить симулированные офисные миры, где модели учатся выполнять реальные рабочие задачи. Там ИИ может, условно, не просто «ответить на вопрос», а разобраться с путаницей в календаре, переписке, задачах и дедлайнах, как это пришлось бы делать живому сотруднику.

Но вместе с этим быстро растут и вопросы к приватности. Даже если компании обещают анонимизировать данные, эксперты предупреждают, что полностью обезличить годы рабочих коммуникаций очень трудно. Внутренние чаты и письма — это не абстрактный текст, а следы реальных людей, их манеры общения, конфликтов, ошибок и решений. И если такую информацию обработают недостаточно аккуратно, она может либо утечь, либо всплыть в ответах самих моделей.