Русские голосовые движки и применение Google Api TTS
Много копий поломано в спорах относительно голосовых движков. Одно несомненно, будущее у них есть и будущее большое, от собственно озвучивания текстов до голосового управления смартфонами и персональными компьютерами. Тем не менее, несовершенство представленных на сегодняшний день TTS (text-to-speech system) бросается в глаза. Связано это в первую очередь со сложностью русского языка и нежеланием вкладывать колоссальные средства в разработки, судьба которых туманна, если не брать в расчет планы моментальной продажи исходников на корню.
Лидером среди русских движков остается Digalo с мужским голосом Николай и женским Алена от французского производителя Acapela Group. Существует еще огромное количество вариантов, как от гигантов индустрии (Microsoft), так и от региональных разработчиков (Центр речевых технологий). Целью данного материала не является обзор существующих голосов, мы лишь хотим подчеркнуть – выбор есть и выбор этот, к сожалению, сводится к отбору лучшего из худших.
Отдельные варианты программного обеспечения существуют и для мобильных устройств. Самыми распространеннымыми и устанавливаемыми по умолчанию являются продукты Pico, в которых нет собственного голосового движка для русского языка, а так же разработка SVOX с ужасным мужским голосом Юрий и слегка выигрывающим у него женским – Катерина. Применение SVOX способно, пускай и с трудом, удовлетворить потребность прочтения смс вслух, но слушать полноценную книгу в таком прочтение совершенно невозможно, несмотря на весьма дружелюбные интерфейсы для андроид-читалок, таких как Moon Reader или FB Reader.
Впрочем, не все так печально. Существуют и активно развиваются online сервисы для двусторонних преобразований текста и речи. Лидерами в этой области являются Microsoft и Google. По целому ряду параметров, останавливаться на которых нет смысла, Microsoft серьезно отстает. Сосредоточимся на предложениях крупнейшего поисковика.
Что нам доступно уже сегодня? Во-первых – голосовой ввод и обработка информации, а так же перевод текста в звук представлены непосредственно на сайте поисковой системы. По аналогии с главной страницей, развернут сервис и для андроид устройств. Главной отличительной особенностью решений Google является игнорирование вашего «железа» для нужд синтеза речи. Пользователю не потребуется можный компьютер и набор персональных словарей, все что нужно – хороший интернет-канал. Любая информация обрабатывается мощностями самого сервиса, передавая вам в итоге готовый звук.
Какой именно движок использует Гугль – мы не знаем. Есть мнение, что это модернизированное решение от Acapela, но есть и другой мнение, о доработке системы приобретенной поисковым гигантом компании GIPS. В любом случае, самое интересное, возможность качественного русского синтеза голоса, предоставляется каждому и бесплатно.
Попробовать, как это работает, можно просто зайдя на сайт переводчика Google – ввести туда текст и в нижнем правом углу нажать пиктограмму «прослушать». Более того, Google позволяет сторонним разработчикам и сервисам применять это его решение на основе Google TTS Api. Именно так функционирует например онлайн переводчик Dicter. Установив на компьютере это приложение вы сможете использовать Google Translate в более дружелюбном интерфейсе, хотя функционал, в том числе, разумеется, и синтез речи, по сути своей останется неизменным.
Другое любопытное применение API – встраивание его непосредственно в браузер Chrome. Для этого нам потребуется дополнительное расширение, например SpeakIt!. Установив это расширение, вы сможете прослушать любой текст на странице, выделив его мышкой и отдав команду speak. Предложены два русских голоса – мужской и женский, доступна регулировка по скорости, громкости и высоте тона. По нашему скромному мнению, продукт Google серьезно превосходит любые доступные на сегодняшний день варианты русских голосовых движков. Предлагаем пример озвучивания страницы «о клубе»
Исполнитель: Ирина Воробьева Жанр: Современный детектив Серия: Свидание с детективом Издательство: Нигде не купишь Продолжительность: 06:02:45 Качество: mp3, 48 kbps, 22050 Hz, Mono Размер: 129,18 mb Год выпуска: 2022
Журналистке Кате Зориной, можно сказать, повезло – она отправилась в командировку в Крым в бархатный сезон! Конечно, повод для поездки был не самый приятный: надо помочь выручить из беды Сергея Маратова, подозреваемого в причастности к исчезновению его девушки Инны. Влюбленные отправились в горы, где Сергей неудачно упал и сломал ногу, Инна побежала за помощью, и больше ее не видели ни живой н......