Преобразование текста в речь (TTS): особенности, область применения

Статьи и Лайфхаки

Технология TTS (text to speech) относится к разряду тех, которые доступны практически любому владельцу смартфона, ~~кроме вовсе уж антикварных экземпляров~~, но при этом далеко не каждый не то что пользуется, но вообще знает о ее существовании.

Что поделать, в современных девайсах имеются возможности на все случаи жизни, и далеко не все из них востребованы подавляющим большинством аудитории.

Постараемся в общих чертах рассказать, как все это работает, а также кому и в чем может оказаться полезным.

Разновидности TTS

Преобразование текста в речь (TTS): особенности, область применения

Сама идея озвучивать текст голосом далеко не нова. И первые попытки были еще в досмартфонную эпоху. Как только вычислительная мощность процессоров достигла определенных величин, они перешли в область реального применения.

Однако до последнего времени TTS обладала серьезными недостатками. Компьютеры «не умели» даже в минимальной степени воспроизводить интонацию, а звучание голоса было как у робота из низкобюджетного фильма: металлизированным, насквозь искусственным.

Нет, даже такой результат был более чем востребован, но все же как разработчикам, так и пользователям хотелось бы большего. И это большее появилось с развитием и массовым распространением нейросетей.

Именно они дали возможность создать т.н. Neural TTS. В отличие от базовой версии технологии, синтезированный таким образом голос максимально приближен к натуральному, и зачастую их очень сложно отличить.

Зачем это массовому пользователю?

Причин, по которым тот или иной человек может воспользоваться TTS, не так уж мало. И их круг отнюдь не ограничивается специальными возможностями для тех, кто страдает нарушением зрения.

Те, кто не любит читать, а предпочитает слушать аудиокниги, нередко досадуют на то, что их любимые произведения ~~ленивые паршивцы-чтецы~~ до сих пор не озвучили. Никаких проблем – за них это сделает компьютер или смартфон.
Хочется прочесть свеженькую книгу, но времени категорически не хватает. Но можно одновременно убираться в квартире и слушать бестселлер в приятной озвучке.

Читайте также: Power Bank (внешний аккумулятор): что это такое и какой выбрать
Изучая иностранные языки, очень полезно слышать, как звучит та или иная фраза в оригинальном произношении. Причем не единственное слово, а целый фрагмент.
Контекстный перевод – это довольно-таки удобно, но еще удобнее просто озвучить выбранный фрагмент текста на родном языке.

Нельзя не упомянуть и программу TalkBack, при помощи которой можно управлять смартфоном, не видя экрана: каждое действие пользователя озвучивается голосом.

TTS на различных платформах

Штатные синтезаторы речи имеются как в iOS, так и в Android. Однако если «яблочная» операционная система обновляется регулярно почти на всех устройствах, кроме самых старых, которые Apple снимает с поддержки, то у «ведра» все, как всегда, ~~через афедрон~~ немного сложнее.

Встроенная TTS под названием Google Speech Services появилась только в середине 2017 года в Android 8 Oreo.

В более ранних версиях возможность озвучивать тексты отсутствует, если только не воспользоваться сторонними приложениями. Но даже тогда возникает проблема с интеграцией синтеза в прочий софт, которая была решена в более поздних версиях Android.

В них установленный из Google Play синтезатор можно просто задать как основной через опцию «Альтернативное приложение» в настройках.

Чтобы воспользоваться возможностями TTS в Android, нужно выполнить следующие действия:

Открыть через шестеренку вкладку «Настройки».
Далее через пункт «Специальные возможности» открыть «Синтез речи».
Выбрать желаемый язык, настроить скорость речи и тон озвучки.

В iOS все делается по следующей схеме:

В разделе Настроек открываем пункт «Универсальный доступ». Некотрых версиях ОС он может быть «закопан» в подраздел «Основные».
Перейдя в раздел «Устный контент», включаем функции «Экран вслух» и «Проговаривание», передвинув соответствующий ползунок.
В строке «Речевой контроллер» выберите желаемый контроллер.
Вернувшись в меню «Устный контент», можно настроить тип голоса, диалект и скорость произношения.

Кроме того, можно озвучить экран, обратившись к соответствующему голосовому помощнику и отдав команду «читать экран вслух».

В заключение

Возможности озвучивания текстов в современных устройствах весьма обширны. И со временем они будут только расширяться. Хотя в целом прослушивание озвученных синтезатором книг – вопрос вкуса.

Некоторые читатели не то что не готовы к подобному – они вообще не получают удовольствия от чтения книг с экрана, предпочитая бумажные версии.

Но даже такие ретрограды едва ли станут отрицать пользу TTS, например, при изучении иностранных языков. Так что с каждым годом аудитория пользователей технологии будет только расширяться.

Подписывайтесь на нас в Telegram и ВКонтакте.

Сергей Семенов, 31 год Аналитик, журналист, редактор

Настоящий мобильный эксперт! Пишет простым и понятным языком полезные статьи и инструкции мобильной тематики, раздает направо и налево наиполезнейшие советы. Следит за разделом «Статьи и Лайфхаки».

Другие материалы автора

Реклама на сайте

Оцените, пожалуйста:

5 из 5

Прочитало: 26 484 человек

Нашли в тексте ошибку?

Выделите её, нажмите Ctrl + Enter, и мы все исправим!