Новости 15:08, 12 мая 2026

OpenAI добавила в API новые голосовые модели

Они умеют переводить и распознавать речь в реальном времени.

OpenAI добавила в Realtime API три новых голосовых модели: GPT‑Realtime‑2 (диалоговый голосовой ассистент с GPT‑5‑уровнем рассуждений), GPT‑Realtime‑Translate (синхронный перевод) и GPT‑Realtime‑Whisper (онлайн расшифровка речи в текст).

Realtime‑Translate поддерживает более 70 языков на входе и 13 языков на выходе, стараясь «успевать» за живой речью пользователя.

Realtime‑Whisper обеспечивает потоковый speech‑to‑text по мере разговора, а все три модели предназначены для сценариев вроде клиентской поддержки, образования, медиа и creator‑платформ.

Translate и Whisper тарифицируются поминутно, а GPT‑Realtime‑2 — по токенам, как и другие языковые модели OpenAI.

OpenAI заявляет, что встроила защиту от спама, мошенничества и другого злоупотребления: разговоры могут автоматически прерываться при нарушении контент‑политик.

Еще новости

DeepSeek открывает лабораторию в Пекине для оптимизации предобучения на чипах Ascend и NVIDIA

Разработчик усомнился в корректности бенчмарка Prinzbench после низкого результата GLM-5.2

Движение данных, а не вычисления, определяет энергопотребление GPU, утверждает исследователь