Они умеют переводить и распознавать речь в реальном времени.
OpenAI добавила в Realtime API три новых голосовых модели: GPT‑Realtime‑2 (диалоговый голосовой ассистент с GPT‑5‑уровнем рассуждений), GPT‑Realtime‑Translate (синхронный перевод) и GPT‑Realtime‑Whisper (онлайн расшифровка речи в текст).
Realtime‑Translate поддерживает более 70 языков на входе и 13 языков на выходе, стараясь «успевать» за живой речью пользователя.
Realtime‑Whisper обеспечивает потоковый speech‑to‑text по мере разговора, а все три модели предназначены для сценариев вроде клиентской поддержки, образования, медиа и creator‑платформ.
Translate и Whisper тарифицируются поминутно, а GPT‑Realtime‑2 — по токенам, как и другие языковые модели OpenAI.
OpenAI заявляет, что встроила защиту от спама, мошенничества и другого злоупотребления: разговоры могут автоматически прерываться при нарушении контент‑политик.