После закрытия компаний их внутренние переписки, тикеты и рабочие документы неожиданно превратились в ценный актив. ИИ-лаборатории всё чаще покупают такой «цифровой след» как редкий источник данных для обучения агентных моделей, которые должны не просто отвечать на вопросы, а работать как сотрудники.
Когда раньше стартап закрывался, его активами обычно считались код, бренд, клиенты или патенты. Теперь к этому списку добавился ещё один пункт: многолетние архивы переписок, задач и документов. Всё то, что остаётся после ежедневной работы команды — обсуждения в Slack, письма, комментарии в Jira, файлы в Google Drive, — начали продавать как обучающие данные для ИИ.
Именно так, например, произошло с компанией cielo24. Во время закрытия её бывший гендиректор Шанна Джонсон обнаружила, что 13 лет корпоративной истории — от рабочих писем до внутренних шуток в Slack — можно продать за «сотни тысяч долларов». По её словам, эти деньги помогли аккуратно завершить ликвидацию бизнеса и покрыть расходы.
Почему это вообще кому-то нужно? Потому что обычный интернет для обучения ИИ уже не даёт того, что сейчас ищут разработчики. Публичные тексты хорошо подходят для общих языковых моделей, но плохо учат ИИ действовать в рабочих процессах. А вот внутренняя жизнь компаний — это уже готовые примеры того, как люди координируют задачи, спорят, ошибаются, принимают решения и доводят проекты до конца. Для агентного ИИ, который должен вести календарь, писать письма, разруливать задачи и работать с офисным хаосом, такие данные особенно ценны.
На этом фоне начал формироваться целый новый рынок. Компании вроде SimpleClosure и Sunset, которые помогают стартапам закрываться, теперь не просто оформляют ликвидацию, но и продают их «цифровые остатки» ИИ-компаниям. По словам участников рынка, спрос на такие данные огромный, а цены зависят от размера компании, возраста архива и того, насколько хорошо данные связаны между собой. Например, тикет в Jira, который можно привязать к конкретному коммиту и обсуждению в почте, стоит дороже, чем просто одинокий документ без контекста.
Следом вырос и другой сегмент — так называемые RL gyms, или тренировочные площадки для ИИ-агентов. Их создатели используют архивы закрывшихся компаний, чтобы строить симулированные офисные миры, где модели учатся выполнять реальные рабочие задачи. Там ИИ может, условно, не просто «ответить на вопрос», а разобраться с путаницей в календаре, переписке, задачах и дедлайнах, как это пришлось бы делать живому сотруднику.
Но вместе с этим быстро растут и вопросы к приватности. Даже если компании обещают анонимизировать данные, эксперты предупреждают, что полностью обезличить годы рабочих коммуникаций очень трудно. Внутренние чаты и письма — это не абстрактный текст, а следы реальных людей, их манеры общения, конфликтов, ошибок и решений. И если такую информацию обработают недостаточно аккуратно, она может либо утечь, либо всплыть в ответах самих моделей.