Новости 15:08, 12 мая 2026
Поделиться

OpenAI добавила в API новые голосовые модели

OpenAI добавила в API новые голосовые модели

Они умеют переводить и распознавать речь в реальном времени.

OpenAI добавила в Realtime API три новых голосовых модели: GPT‑Realtime‑2 (диалоговый голосовой ассистент с GPT‑5‑уровнем рассуждений), GPT‑Realtime‑Translate (синхронный перевод) и GPT‑Realtime‑Whisper (онлайн расшифровка речи в текст).

Realtime‑Translate поддерживает более 70 языков на входе и 13 языков на выходе, стараясь «успевать» за живой речью пользователя.

Realtime‑Whisper обеспечивает потоковый speech‑to‑text по мере разговора, а все три модели предназначены для сценариев вроде клиентской поддержки, образования, медиа и creator‑платформ.

Translate и Whisper тарифицируются поминутно, а GPT‑Realtime‑2 — по токенам, как и другие языковые модели OpenAI.

OpenAI заявляет, что встроила защиту от спама, мошенничества и другого злоупотребления: разговоры могут автоматически прерываться при нарушении контент‑политик.