Новости 04:37, 11 июня 2026
Поделиться

Google DeepMind представила потоковую модель перевода речи Gemini 3.5 Live Translate

Компания Google DeepMind анонсировала модель Gemini 3.5 Live Translate, которая обеспечивает синхронный перевод речи в речь на более чем 70 языках. Инструмент доступен для тестирования в ограниченном режиме.

Google DeepMind расширила возможности своей линейки моделей Gemini, представив новую версию для потокового перевода речи — Gemini 3.5 Live Translate. Модель поддерживает более 70 языков и диалектов, включая редкие и малоресурсные, и способна обрабатывать речь в реальном времени с минимальной задержкой. Как отметили в компании, ключевое отличие новой разработки — возможность сохранять интонацию и эмоциональную окраску речи говорящего, что приближает качество перевода к естественному общению.

Инструмент уже доступен для ограниченного тестирования через платформу Google Cloud и интегрирован в ряд корпоративных решений для международных коммуникаций. По словам технического директора Google Джеффа Дина (Jeff Dean), Gemini 3.5 Live Translate ориентирована на бизнес-клиентов и государственные организации, которым требуется мгновенный перевод без потери контекста. «Мы стремимся сократить языковые барьеры в глобальном масштабе, и эта модель — шаг к тому, чтобы сделать общение между людьми разных культур максимально естественным», — заявил Дин в своём посте.

Разработчики подчеркнули, что модель обучена на массиве данных, включающем как публичные источники, так и специализированные корпоративные наборы, что позволяет ей адаптироваться к профессиональной лексике. Среди поддерживаемых языков — арабский, хинди, суахили, а также ряд диалектов китайского и испанского. При этом Google не раскрывает точные метрики качества перевода, ссылаясь на продолжающееся тестирование.

Эксперты отмечают, что выход Gemini 3.5 Live Translate усиливает конкуренцию в сегменте систем синхронного перевода, где ранее лидировали решения от Meta и стартапов вроде DeepL. Аналитик в области ИИ Филипп Шмид (Philipp Schmid) указал, что ключевым преимуществом модели Google может стать интеграция с экосистемой компании, включая Google Meet и корпоративные мессенджеры. В то же время, по его словам, качество перевода на редкие языки пока остаётся «пятном слабости» для всех игроков рынка.

Источники: X-пост Джеффа Дина (Jeff Dean), 9 июня 2026; X-пост Филиппа Шмида (Philipp Schmid), 9 июня 2026; блог Google DeepMind.