Игры и Спорт

Google представила технологию синхронного перевода устной речи Translatotron

20.05.2019 11:37

Google представила технологию синхронного перевода устной речи Translatotron

Такие каскадные системы, доведённые до совершенства, с триумфом используются во многих коммерческих технологиях устного перевода, включая Google Translate.

Google представила новейшую технологию синхронного перевода устной речи — Translatotron. Соответствующая информация приводится в блоге компании. Основное отличие Translatotron в том, что он пропускает этот этап и работает напрямую со звуком — система создаёт «слепок» начальной речи и преобразует ее. Голос переводчика Translate звучит слегка роботизировано, однако считывание и воспроизведение особенностей речи говорящего является настоящим прогрессом. Речь генерируется в новейшую спектрограмму на целевом языке, в итоге скорость и точность перевода вырастают.

Одной из основных особенностей Translatotron создатели называют возможность сохранения в переведённом отрезке вокальных характеристик (интонаций и пауз) говорящего, что делает его «более очевидным и наименее резким».

Тут можно послушать как звучит выполненный алгоритмом перевод с одного языка на другой. До этого Google объявил о планах обучить собственный метод распознавания голоса понимать слова людей, страдающих нарушениями речевого аппарата. Новый Translatotron дает не менее реальный перевод, чем базовая каскадная модель, подчеркнули в компании.

«Translatotron исключает разделение задачи на отдельные этапы, что дает несколько преимуществ перед каскадными системами», — сообщается в заявлении. Новый Translatotron промежуточные шаги пропускает и непосредственно переводит язык пользователя на другой.

Переведенная речь еще синтезируется и звучит несколько роботизированно, однако может продуктивно поддерживать некоторые субъекты голоса говорящего. Таким образом, при наличии достаточной вычислительной мощности Translatotron способен выполнять перевод быстрее. Первоначально речь должна быть интерпретирована машиной и расшифрована в текст, который после этого будет переведен на нужный язык, до того как поступить в механизм преображения текста в речь для произнесения его вслух.

Авторы полагаются, что их работа послужит отправной точкой для для последующих исследований машинных технологий прямого устного перевода.

Источник

2024 © "Игры и Спорт". Все права защищены. Карта сайта.