Компания, известная прежде всего переводом текста и документов, представила линейку инструментов для голосового перевода в реальном времени. DeepL нацелилась на созвоны, личные разговоры, обучение сотрудников и корпоративные сценарии вроде колл-центров.
DeepL представила набор продуктов для перевода речи в речь. Новый сервис рассчитан на несколько сценариев сразу: встречи в Zoom и Microsoft Teams, разговоры через мобильные устройства и браузер, а также групповые сессии — например, тренинги или воркшопы, где участники могут подключаться по QR-коду.
По словам главы компании Ярека Кутыловского, после многих лет работы с текстовым переводом выход в голос был для DeepL логичным следующим шагом. В компании считают, что на рынке до сих пор не хватало действительно сильного продукта для перевода живой речи в реальном времени.
Сейчас система работает в несколько этапов: сначала распознаёт речь, затем переводит текст, а после заново озвучивает его на нужном языке. DeepL делает ставку на то, что её сильная сторона — именно качество перевода, потому что компания долго развивала текстовые модели. В будущем она хочет перейти к полноценной end-to-end-модели, которая сможет переводить голос сразу в голос, без промежуточного текстового слоя.
Для корпоративных клиентов DeepL также открывает API, чтобы партнёры могли встраивать технологию в собственные продукты — например, в сервисы поддержки или внутренние инструменты. Отдельно компания подчёркивает, что система умеет адаптироваться к кастомной лексике: названиям компаний, имёнам людей и отраслевым терминам.
В DeepL считают, что особенно востребованным такой перевод будет в клиентском сервисе, где компаниям часто не хватает сотрудников со знанием нужных языков. Переводческий слой, встроенный поверх разговора, должен помочь закрывать такие задачи без полноценного найма в каждом регионе.
Выход DeepL в этот сегмент означает, что компания теперь идёт в более прямую конкуренцию с новыми ИИ-стартапами, которые занимаются переводом и синтезом речи в реальном времени. Но в DeepL явно рассчитывают, что накопленный опыт в текстовом переводе даст им преимущество и в голосе.