Генеральный директор Perplexity Аравинд Шринивас (Aravind Srinivas) заявил, что крупные компании начнут разрабатывать собственные внутренние циклы оптимизации моделей искусственного интеллекта, чтобы повысить эффективность использования токенов на ватт потребляемой энергии.
Аравинд Шринивас, возглавляющий стартап Perplexity, специализирующийся на поисковых системах с поддержкой ИИ, обозначил ключевой тренд в развитии корпоративных технологий. По его словам, предприятия перейдут к созданию замкнутых циклов разработки, где модели будут оптимизироваться под конкретные задачи с учетом энергоэффективности. Речь идет о снижении затрат на обучение и эксплуатацию моделей за счет точной настройки потребления вычислительных ресурсов.
Шринивас подчеркнул, что традиционные подходы, при которых компании полагаются на готовые модели от внешних поставщиков, уступят место гибридным решениям. Внутренние команды будут адаптировать архитектуры нейросетей под специфические бизнес-процессы, добиваясь максимальной отдачи от каждого токена при минимальных энергозатратах. «Это не просто вопрос экономии — это вопрос конкурентоспособности», — отметил он в недавнем обсуждении на платформе X.
Концепция «токенов на ватт» уже становится метрикой для оценки эффективности ИИ-систем. В условиях роста стоимости электроэнергии и ужесточения требований к углеродному следу компаний оптимизация энергопотребления моделей выходит на первый план. При этом, как отмечают аналитики, переход на собственные циклы разработки потребует от бизнеса значительных инвестиций в инфраструктуру и кадры.
Ранее Perplexity представила собственные инструменты для оптимизации работы языковых моделей, включая методы квантизации и дистилляции, которые позволяют сократить размер моделей без потери качества. Эти технологии могут стать основой для корпоративных решений нового поколения.