Преобразование текста в речь (TTS): особенности, область применения

Преобразование текста в речь (TTS): особенности, область применения

Статьи и Лайфхаки
Технология TTS (text to speech) относится к разряду тех, которые доступны практически любому владельцу смартфона, кроме вовсе уж антикварных экземпляров, но при этом далеко не каждый не то что пользуется, но вообще знает о ее существовании.

Что поделать, в современных девайсах имеются возможности на все случаи жизни, и далеко не все из них востребованы подавляющим большинством аудитории.

Постараемся в общих чертах рассказать, как все это работает, а также кому и в чем может оказаться полезным.

Разновидности TTS

Преобразование текста в речь (TTS): особенности, область применения

Сама идея озвучивать текст голосом далеко не нова. И первые попытки были еще в досмартфонную эпоху. Как только вычислительная мощность процессоров достигла определенных величин, они перешли в область реального применения.

Однако до последнего времени TTS обладала серьезными недостатками. Компьютеры «не умели» даже в минимальной степени воспроизводить интонацию, а звучание голоса было как у робота из низкобюджетного фильма: металлизированным, насквозь искусственным.


Нет, даже такой результат был более чем востребован, но все же как разработчикам, так и пользователям хотелось бы большего. И это большее появилось с развитием и массовым распространением нейросетей.

Именно они дали возможность создать т.н. Neural TTS. В отличие от базовой версии технологии, синтезированный таким образом голос максимально приближен к натуральному, и зачастую их очень сложно отличить.

Зачем это массовому пользователю?


Причин, по которым тот или иной человек может воспользоваться TTS, не так уж мало. И их круг отнюдь не ограничивается специальными возможностями для тех, кто страдает нарушением зрения.

  • Те, кто не любит читать, а предпочитает слушать аудиокниги, нередко досадуют на то, что их любимые произведения ленивые паршивцы-чтецы до сих пор не озвучили. Никаких проблем – за них это сделает компьютер или смартфон.
  • Хочется прочесть свеженькую книгу, но времени категорически не хватает. Но можно одновременно убираться в квартире и слушать бестселлер в приятной озвучке.

  • Изучая иностранные языки, очень полезно слышать, как звучит та или иная фраза в оригинальном произношении. Причем не единственное слово, а целый фрагмент.
  • Контекстный перевод – это довольно-таки удобно, но еще удобнее просто озвучить выбранный фрагмент текста на родном языке.
Нельзя не упомянуть и программу TalkBack, при помощи которой можно управлять смартфоном, не видя экрана: каждое действие пользователя озвучивается голосом.

TTS на различных платформах


Штатные синтезаторы речи имеются как в iOS, так и в Android. Однако если «яблочная» операционная система обновляется регулярно почти на всех устройствах, кроме самых старых, которые Apple снимает с поддержки, то у «ведра» все, как всегда, через афедрон немного сложнее.

Встроенная TTS под названием Google Speech Services появилась только в середине 2017 года в Android 8 Oreo.

В более ранних версиях возможность озвучивать тексты отсутствует, если только не воспользоваться сторонними приложениями. Но даже тогда возникает проблема с интеграцией синтеза в прочий софт, которая была решена в более поздних версиях Android.


В них установленный из Google Play синтезатор можно просто задать как основной через опцию «Альтернативное приложение» в настройках.

Чтобы воспользоваться возможностями TTS в Android, нужно выполнить следующие действия:

  • Открыть через шестеренку вкладку «Настройки».
  • Далее через пункт «Специальные возможности» открыть «Синтез речи».
  • Выбрать желаемый язык, настроить скорость речи и тон озвучки.
В iOS все делается по следующей схеме:

  1. В разделе Настроек открываем пункт «Универсальный доступ». Некотрых версиях ОС он может быть «закопан» в подраздел «Основные».
  2. Перейдя в раздел «Устный контент», включаем функции «Экран вслух» и «Проговаривание», передвинув соответствующий ползунок.
  3. В строке «Речевой контроллер» выберите желаемый контроллер.
  4. Вернувшись в меню «Устный контент», можно настроить тип голоса, диалект и скорость произношения.
Кроме того, можно озвучить экран, обратившись к соответствующему голосовому помощнику и отдав команду «читать экран вслух».

В заключение


Возможности озвучивания текстов в современных устройствах весьма обширны. И со временем они будут только расширяться. Хотя в целом прослушивание озвученных синтезатором книг – вопрос вкуса.

Некоторые читатели не то что не готовы к подобному – они вообще не получают удовольствия от чтения книг с экрана, предпочитая бумажные версии.

Но даже такие ретрограды едва ли станут отрицать пользу TTS, например, при изучении иностранных языков. Так что с каждым годом аудитория пользователей технологии будет только расширяться.

Подписывайтесь на нас в Telegram и ВКонтакте.






Сергей Семенов, 31 год Аналитик, журналист, редактор
Настоящий мобильный эксперт! Пишет простым и понятным языком полезные статьи и инструкции мобильной тематики, раздает направо и налево наиполезнейшие советы. Следит за разделом «Статьи и Лайфхаки».
Оцените, пожалуйста:
   5 из 5
Прочитало: 8 908 человек
Нашли в тексте ошибку?

Выделите её, нажмите Ctrl + Enter, и мы все исправим!

Угадаешь? Тогда ЖМИ!
Интересно!
Пять провальных технологий, не прижившихся в смартфонах
Пять провальных технологий, не прижившихся в смартфонах
Вверх страницы