Глава OpenAI Сэм Альтман (Sam Altman) анонсировал разработку передовой языковой модели, которая сможет генерировать текст со скоростью до 750 токенов в секунду. Релиз запланирован на июль 2026 года.
Сэм Альтман, генеральный директор OpenAI, опубликовал в социальной сети X намёк на скорый запуск новой языковой модели, которая станет одной из самых быстрых в индустрии. По его словам, система достигнет скорости генерации 750 токенов в секунду — это в несколько раз превышает показатели существующих аналогов.
Альтман не раскрыл технических деталей, однако в отрасли уже высказываются предположения о возможных архитектурных изменениях. Например, инженер компании Scale AI Стивен Хайдел (Steven Heidel) в своём комментарии отметил, что такая производительность может потребовать оптимизации как аппаратной части (например, использования специализированных ускорителей), так и программных алгоритмов вывода.
Пока неясно, будет ли новая модель частью линейки GPT или станет отдельным продуктом. В OpenAI не комментируют сроки и характеристики разработки, однако в прошлом компания уже демонстрировала прототипы с повышенной скоростью генерации — например, в рамках экспериментов с моделями для корпоративных клиентов.
Рекордные 750 токенов в секунду позволят значительно ускорить работу чат-ботов, систем автоматического перевода и других приложений, где важна низкая задержка. Для сравнения: современные модели, такие как GPT-4o, в среднем генерируют около 50–100 токенов в секунду на стандартном оборудовании.
Источники: X-пост Сэма Альтмана (Sam Altman), 27 июня 2026; комментарий Стивена Хайдела (Steven Heidel).