# Google выпустила обновлённую модель озвучки текста на базе Gemini 3.1 Flash

> Новая TTS-модель умеет управлять подачей речи прямо внутри текста — через теги вроде «шёпотом» или «кричит» — и, по данным Artificial Analysis, уже обошла ElevenLabs v3 по качеству синтеза.&nbsp; Google добавила в Gemini 3.1 Flash поддержку более продвинутой...

- Canonical HTML: https://youragents.me/ru/media/news/google-vypustila-obnovljonnuju-model-ozvuchki-teksta-na-baze-gemini-3-1-flash
- Markdown: https://youragents.me/ru/media/news/google-vypustila-obnovljonnuju-model-ozvuchki-teksta-na-baze-gemini-3-1-flash.md
- Section: Новости
- Published: 2026-04-16T16:36:00+03:00
- Modified: 2026-04-16T16:36:00+03:00

Новая TTS-модель умеет управлять подачей речи прямо внутри текста — через теги вроде «шёпотом» или «кричит» — и, по данным Artificial Analysis, уже обошла ElevenLabs v3 по качеству синтеза. &nbsp;

Google добавила в Gemini 3.1 Flash поддержку более продвинутой генерации речи. Модель умеет превращать текст в естественно звучащее аудио и понимает встроенные аудиотеги в квадратных скобках, которые задают манеру исполнения — например, шёпот, крик или более эмоциональную подачу. 

В независимом рейтинге Artificial Analysis модель Gemini 3.1 Flash TTS сейчас стоит выше Eleven v3 от ElevenLabs. Выше неё в таблице находится только Inworld TTS 1.5 Max.&nbsp;

Google пишет, что функцию можно использовать через Gemini API и тестировать в Google AI Studio. Для подключения к продуктам и сервисам доступны те же инструменты экосистемы Gemini и Vertex AI, что и для других моделей линейки.&nbsp;

Отдельный акцент компания делает на мультиязычности: модель поддерживает десятки языков, а встроенные теги позволяют точнее управлять интонацией и стилем озвучки без отдельной настройки голоса. Это делает её заметно ближе к сценариям, где раньше чаще выбирали ElevenLabs.&nbsp;