Клуб Любителей Аудиокниг
 
КАТАЛОГ АУДИОКНИГ
Исполнители
Авторы
Рецензии
Название
Список исполнителей на букву:
Поиск исполнителей:
НАЙТИ!
Список рецензий на букву:
Поиск рецензий:
НАЙТИ!
Список авторов на букву:
Поиск авторов:
НАЙТИ!
Список аудиокниг на букву:
Поиск аудиокниг:
НАЙТИ!





Хотите подписаться на наши обновления?


Клуб в социальных сетях:
Клуб любителей Аудиокниг - Твиттер  Клуб на ФейсБук  Клуб любителей Аудиокниг - наш канал на YouTube  Канал Клуба Любителей Аудиокниг в Телеграм




Koobaudio. Набор словарей для "Николая"

Пользователям программы Koobaudio (если таковые еще имеются), хочу предложить набор словарей для «Николая», над которыми я работал довольно длительное время, однако последние полтора года они лежит без дела (перешел на "обычные" аудио-книги да и под Вистой Koobaudio у меня не работает). Есть предположение, что пока я прослушаю все интересующие меня книги, записанные живыми людьми, появится голосовой движок с более природным тембром голоса, для которого скорее всего данные словари не подойдут.

Тем не менее, был проделан большой объем работы по улучшению синтезированной Николаем речи и для тех кто еще не перешел на Висту или вообще не собирается уходить с Windows XP, я рекомендую попробовать как саму программу Koobaudio так и словари для нее. Надеюсь, они кому-нибудь да пригодятся, тем более что альтернативы Николаю пока не видно (но это мое субъективное мнение).

Словари создавались и тестировались в программе Koobaudio с голосовым движком Elan Speech Cube 4.2 (предшественника Acapela-Elan).

Словари
http://rapidshare.com/files/137613237/Dic.zip

Elan Speech Cube 4.2
http://rapidshare.com/files/137615734/Elan_Speech_Cube_4.2.zip.html
http://jaws.tiflocomp.ru/synths/elan/index.php

При создании основной упор делался на «ё-фикацию» текста и исправление наиболее часто встречающихся в литературе слов, словосочетаний и омографов.
Кстати, программа позволяет путем анализа текста найти наиболее используемые в тексте слова (и имена собственные), сразу же проверить их голосовым движком и внести необходимые изменения в словарь, не отходя, так сказать, от кассы.

Я решил полностью (в принципе как и рекомендует автор программы) отказаться от словаря «exc_rus.txt» и сосредоточиться на создании словаря в формате "dic". Он намного более эффективный, по сравнению с "родным" словарем, в котором, кстати, большая часть записей (а их может быть и боле 100000 в версии от Acapela), абсолютно бесполезна. Поробуйте удалить все записи из словаря «exc_rus.txt» и вы заметите что Николай будет читать не намного хуже.
    В чем же преимущества словарей с форматом dic?
Например, при их использовании, появляется возможность, с помощью т.н. "подстановочных знаков" и "автозамены" (термины взяты из программы), исправить всего одной записью сразу несколько склонений одного слова, а то и целый ряд одно-коренных слов, что в разы сокращает общий объем работы и размер словаря. Также, вы можете использовать словосочетания и знаки препинания (это поможет при удалении или добавлении пауз, исправлении ошибок в омографах и ёфикации).
С их помощью можно сделать речь более "ровной", т.е. добавить паузы там, где Николай их обычно проглатывает или наоборот убрать там где они были явно не к месту.
    Вот примеры т.н подстановочных знаков *,$ и автозамен:
* в начале слова означает, что будут игнорироваться символы расположенные перед этим знаком.
* в конце слова означает, что будут игнорироваться символы расположенные после этого знака.
* в начале и в конце слова превращают его в т.н. регулярное выражение.

*истов=и<стов - комунистов, анархистов и прочих "истов"
*бубнил*=бубни<л - забубнила, забубнил, пробубнили, пробубнил

$ в начале записи начинает различать регистр букв.

$Где вы=Где<вы - Где вы все были, Где вы делись и т.д

Кстати, словосочетание "Где вы" в начале предложения встречается намного чаще чем что-то вроде "парастоти<ческого", и слушать "Гдевы< были" вместо более природного "Где<вы были" придеться гораздо чаще. В общем если попытаться устранить наиболее распространенные ошибки и режущие слух недостатки, а не просто исправлять произношение всех подряд слов, во всех их склонениях, то такую речь Николая сможет слушать, без содрогания, даже человек неподготовленный )

В принципе с помощью предложенных мною словарей можно не без удовольствия слушать худ. литературу не перегруженную специфическими терминами.

Так что для тех кто смог дочитать до этого места и решил попробовать выложенные словари, дам несколько рекомендаций.
  • 1. Установите программу и голосовой движок «Elan Speech Cube 4.2». С более новыми версиями Николая, вроде «Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_MmE255», могут быть проблемы, так как они не понимают, как ударение, знак «<», используемый в словарях формата dic. Может быть, эта проблема уже решена, я на данный момент не в курсе.
  • 2. Скопируйте словари из архива в директорию "c:\Program Files\KooBAudio\Dic\".
    При использовании редактора словарей, вместо пункта "редактировать словарь Speech Cube" включите "редактировать словарь Koobaudio"
  • 3.Не объединяйте словари в один. Используйте их только вместе и только в том порядке, в каком они пронумерованы. Словари "года" и "аббревиатуры" можете отключать и включать их по мере необходимости. Особенно это касается словаря "года", который получился очень объемным и будет сильно замедлять процесс обработки текста словарем, лучше его отключать.
  • 4. Обрабатывайте текст словарями перед записью книг, для это выберете соответствующий пункт в меню записи.
Теперь осталось лишь заняться поиском книг
Приятного прослушивания!


© alexv07 :: Клуб Любителей Аудиокниг :: www.abook-club.ru



Аудиокнига: Рубина Дина - Дизайнер Жорка 1. Мальчики
Автор: Рубина Дина
Название: Мальчики
Исполнитель: Рубина Дина
Цикл/серия: Дизайнер Жорка
Номер книги: 1
Качество: mp3, 128 kbps, 44 kHz, Stereo
Размер: 822,1 MB
Длительность: 14:52:04
Описание:
Новая авантюрно-пронзительная история от блестящего прозаика - Дины Рубиной. В первой книге читателю предстоит захватывающее путешествие из довоенной Варшавы в советскую Астрахань, из военной Бухары - в послевоенную Польшу…
В доме десятилетнего Ицика на разные голоса отсчитывают время 387 часов. Уникальную коллекцию начал собирать дед мальчика, а затем продолжил отец - оба и......


О клубе :: Ресурсы :: Правообладателям :: Обратная связь :: ЧаВо :: Полезно :: Форум

Анклавы Клуба в социальных сетях:
Клуб любителей Аудиокниг - Твиттер  Клуб на ФейсБук  Клуб любителей Аудиокниг - наш канал на YouTube  Канал Клуба Любителей Аудиокниг в Телеграм  
подписаться на почтовую рассылку
abook-club.ru 2004-2021
Дизайн: yuriy12, Alexxus, Верстка: gracer, Поддержка каталога: vTinka & co
Администрирование сервиса: nicksu, Выборочная корректура: smb46
Программирование: Виталий Ляпота (a.k.a. Vitalik)