Исследователи обнаружили, что командный инструмент Claude Code от компании Anthropic содержит встроенные геолокационные маркеры, которые автоматически добавляются в системные подсказки при генерации кода. Анализ провели независимые специалисты по ИИ и разработчики ПО.
Независимый анализ инструмента командной строки Claude Code, разработанного компанией Anthropic, выявил наличие скрытых маркеров местоположения в системных подсказках (system prompts). Эти маркеры, как утверждают исследователи, автоматически встраиваются в запросы к модели и могут влиять на её поведение в зависимости от географического контекста.
Обнаружение сделал австрийский разработчик Петер Штайнбергер (Peter Steinberger), основатель компании PSPDFKit, специализирующейся на технологиях для работы с PDF. В своём анализе он отметил, что при использовании Claude Code в системные подсказки добавляются координаты, соответствующие штаб-квартире Anthropic в Сан-Франциско (37,7749° с. ш., 122,4194° з. д.). Штайнбергер предположил, что это может быть частью механизма локализации или тестирования модели, однако не исключил и другие сценарии — например, сбор данных о пользователях.
Результаты Штайнбергера подтвердила исследовательница из EleutherAI Стелла Бидерман (Stella Biderman). Она указала, что подобные практики не являются стандартными для индустрии и могут вызывать вопросы о прозрачности работы инструментов на базе ИИ. «Если маркеры действительно влияют на вывод модели, пользователи должны об этом знать», — написала Бидерман в своём комментарии к публикации Штайнбергера.
Anthropic пока не дала официальных комментариев по поводу обнаруженных маркеров. Инструмент Claude Code позиционируется как помощник для разработчиков, позволяющий генерировать, объяснять и отлаживать код через командную строку. В документации к продукту информация о геолокационных данных не упоминается.
Ранее в отрасли уже возникали дискуссии о неявных механизмах сбора данных в инструментах на базе больших языковых моделей. В частности, обсуждались случаи, когда модели запоминали и воспроизводили конфиденциальную информацию из обучающих датасетов.