Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Клуб Любителей АудиоКниг > Синтез речи > Голосовые движки


Автор: Игорь 1.04.2006 - 10:41:17
Вот, насколько я знаю, самый продвинутый на сегоднешний день синтезатор голоса (русский) "RealSpeak Russian Voice". Сам пробовал, читает "она" получше дигалы, но все равно, до идеала конечно далеко smile.gif
1: http://www.megaupload.com/?d=6Y735IBO
зеркало: http://d.turboupload.com/d/121208/Katya.zip.html

Автор: Mrak 8.04.2006 - 15:24:48
надеюсь что это сообщение не будет повторным.

один из лучших звуковых движков(по моему даже лучше Николая):
пасс: ru-board_soft
http://rapidshare.de/files/6812242/Kat.rar.html

и удобная программка в которой она может читать - TextAloud v2.162(по моему грузиться поскорее Говорилки...ИМО):
http://0daycn.net/0daycn/8a28d1df57922c88.asp

Автор: LKa48 9.04.2006 - 00:03:39
Ну в общем-то это известная "Катерина".
Да, она лучше Николая. Это известно. Но, еще НАМНОГО хуже англоязычных Голосов (AT&T,например).

Пожалуйста читайте соовтетствующие темы в этом форуме.

Автор: admik 9.04.2006 - 00:06:59
а мы туда это ща...

Автор: BusGuide 17.04.2006 - 17:34:54
"О вкусах не спорят: из-за вкусов бранятся, скандалят и ругаются" -- Гилберт Кит Честертон

Хочет человек попробовать - ну пусть попробует...

To парус:
Вот, залил. Пробуй.

link: http://slil.ru/22689887 (~46 Мб)
psw: katerina

PS Для работы этого TTS-движка нужен SAPI (Speech API) 5-ой версии (в WinXP установлен по умолчанию).
Дистрибутив v5.1 весит ~12.2 Мб. Живет, например
Код
http://www.beiley.com/programs/acallerid/ttseng5f.exe


Digalo (v1.x, которая обычно ходит в виде файла DigaloCoreRus.exe) работает с SAPI версии 4a, который живет
Код
http://activex.microsoft.com/activex/controls/sapi/spchapi.exe

Для WinXP его нужно устанавливать.

Автор: парус 18.04.2006 - 09:37:42
Ну спасибо!!!
У меня нет слов что бы выразить благодарность. Уже почти месяц роюсь в сети, ни одна ссылка не работает.
Как у тебя все просто: «вот залил», нечего сказать—цивилизация.
Мне что бы Катьку закачать потребуется как минимум, часов 5-6 в сети провисеть. Я не сомневаюсь что она этого стоит. Сегодня за ночь обязательно скачаю.
Ещё раз, громадное тебе СПАСИБО и всех благ, которых только может пожелать человек.

Автор: Langer 19.04.2006 - 15:56:39
Рекомендую всем:
Код
http://www.mp3book2005.narod.ru/4.htm

Автор: парус 21.04.2006 - 10:44:00
Катерину скачал, теперь новые вопрсы: какие программы работают с Катькой и где взять словарь проиизношений?

Автор: XPhantom 25.04.2006 - 02:05:25
Я пробовал. Но я вот только что скачал первую версию. а есть уже третья!!!!!! Кто пробовал третью, что можете сказать? Кто пробовал вторую? По сравнению с дигало, катериной, лучше или хуже???

Автор: Dueler 1.05.2006 - 11:51:29
BusGuide

Скачал я катерину а psw не подходит мот он не верный?

Автор: BusGuide 1.05.2006 - 13:07:54
Цитата (Dueler @ 1.05.2006 - 12:50)

Скачал я... а psw не подходит... не верный?


Только что для проверки скачал и распаковал - все нормально.
Возможно:
1. Пароль введен невнимательно (если копировал через буфер обмена, то мог прихватить пробел при выделении, а для RAR - это значащий символ)
2. Архив скачался коряво (хотя вряд ли)

To парус

Для работы порекомендую http://www.ice-graphics.com. Очень даже неплохая читалка. Кроме того, бесплатная. wink.gif


Автор: Lee0246 3.05.2006 - 21:47:26
Я здесь первый раз. Но хочу сказать следующее: для того, чтобы создать реальную аудиокнигу - крики, шепот и т.п., надо иметь режессуру, чтобы по ней работали движки, а этого еще долго ждать. А вообще-то есть сайт _http://www.websound.ru, есть там раздел - /Soft/Речевые программы -там все последние программы, и Digalo, и Катерина и Sacrament

Автор: парус 7.05.2006 - 06:08:22
У меня есть ICE Book Reader, почему-то глючит.
Мне понравилась Text-To-Speech Converter 5.13.01 >> (696 кб) — программа для озвучивания Worda, еще ни разу не зависла.
Правда для для установки требуется ещё Microsoft .NET Framework 1.1 (23697 кб)
Кроме того еще пришлось скачать и установить Windows INSTALLER, это ещё 2460 кб,
По поводу Катерины: ссылка на архив с движком уже не работает, точнее работает но скачать практически невозможно – после закачки одного-двух метров, выдается сообщение что размер архива изменился.
На днях наткнулся на кучу ссылок и адресов;
Код
http://www0.krgtu.ru/WD/NewFTP/Multimedia/Utils/RealSpeakRussianVoice/Katya.zip
ftp://ftp.km.ru/v01/Soft/Text/Katya.zip
Пробовал ради интереса закачивать, обе ссылки стартуют нормально.
А дальше качать не пробовал, мне уже не нужно, у меня есть.

Автор: парус 7.05.2006 - 16:57:30
Закачал еще раз ICE Book Reader Professional v8.2
Эта прога вроде работает нормальпо, но все равно слишком все наворочено.



Автор: парус 22.05.2006 - 01:20:25
Цитата
Закачал еще раз ICE Book Reader Professional v8.2
Эта прога вроде работает нормальпо, но все равно слишком все наворочено



похоже тема заглохла.

Автор: Digalo 12.10.2006 - 21:22:31
Дигало Николай(только не тот что TTS2000,а поновее,тот,что Elan Speech Cube под SAPI 5(16 кГц)).А говорят еще новее есть, только никто не видел smile.gif
Будете смеяться и тыкать пальцем( ну это право у Вас никто не отнимет),а может дочитаете до конца.
Несколько лет назад в процессе познания возможностей своего компьютера, я решил научить его читать вслух текстовые файлы, что и продолжаю совершенствовать по настоящее время.
Причины были простыми:
< хотелось слушать не то, что предлагалось и читалось кем-то со стороны, а то что интересно мне, моим друзьям, друзьям друзей и остальным заинтересованным лицам.
<невозможность качать из сети многомегабайтные файлы(да и сейчас большого желания нет и думаю не возникнет).
<нежелание тратить "кровные" на покупку аудио книг, да и того, что интересно днем с "огнем не сыщешь".
<наличие достаточно большой электронной библиотеки(около 20000 тестовых файлов) и возможность пополнять ее с интернетовских электронных библиотек бесплатно(т.е. даром).
<достаточно быстрое получение исходного продукта (не буду называть это аудио книгой, чтобы не травмировать Вашу психику, назовем это "исходный продукт"). На том компе, что был вначале, на это уходила ночь, сейчас 3-4 часа,из текстового файла размером около мегабайта, получается mp3 "исходный продукт" размером 400-600 Мб в зависимости от настроек кодирования в mp3.Если использовать платные варианты txt to mp3 то можно уложиться и в час(и даже меньше).
Возникшие трудности:
<нежелание голосового движка озвучивать текст в доступной для понимания форме. Лекарство одно - словарь произношений. Сейчас мой словарь насчитывает почти 42000 правил произношения и достопочтенный Николай читает практически без ошибок (любую тематику), ну а монотонным его чтение не было никогда, хотя поработать еще есть над чем, да это же в кайф!
<слабая машина (комп), не тянула (притормаживание при чтение и записи) большие по объему словари. Решена полностью (P4 Presscot 3 ггц,1 гб памяти, что по настоящим меркам довольно средняя конфигурация).
<наличие свободного времени, ненапрягаясь можно годика в два уложится (если с нуля)smile.gif,сейчас в сети достойные словарики есть, так что и, напрягаясь, и ненапрягаясь много времени не надо.
Плюсы:
< возможность слушать ВСЁ,ЧТО ХОЧЕШЬ;ВСЁ ЧТО,НРАВИТСЯ;ЛЮБУЮ НОВИНКУ, СКАЧАННУЮ В СЕТИ (через пару часов после попадания на твой комп).
<современных детей не заставишь читать, а вот слушают они с удовольствием (проверенно на своих).
<минимальные финансовые затраты.(805 Гб это ж десяток HDD по 80 Гб, это ж примерно 15000-20000 тыщ денег, даже если считать, что досталось все на халяву.)
А так записал,послушал,отправил друзьям по кругу, они себе скачали, а ты на эту же болванку следующую пишешь и зачем хранить, если знаешь, что через 3 часа у тебя будет то, что ты хошь.(ну конечно кое-что храним, но не в таких объемах, зачем?)
И теперь о самом главном, о чем я до сих пор не сказал это восприятие Ваших аудио книг и наших "исходных продуктов".
Думаю, спорить никто не станет, что неподготовленный человек любую аудио книгу, в не зависимости от чтеца(чтицы) или смоделированного компьютером голоса воспримет сразу неоднозначно(а может, и совсем не воспримет, и вернется к бумаге). Звуковые книги НАДО УЧИТЬСЯ СЛУШАТЬ.А так как на вкус и цвет сами знаете, что...
Поэтому относится с "высока" к тем людям, кто научился слушать "неживые" книги, думаю опрометчиво, и я благодарен тем людям, кто в опрос внес нашего неживого Николая, дав нам шанс высказать свое мнение.
P.S. Никого обидеть не хотел. Уважаю Вашу точку зрения, но и Вы уважайте нашу.
P.P.S Сильно не пинайте,так чуть-чуть для приличия. smile.gif
P.P.P.S А вот ответов не будет,сказано все!
Спасибо за внимание.

Автор: Nata 12.10.2006 - 22:05:52
Странно... Запуганный какой-то, новенький наш Digalo...Ну слушает себе чел робота... Ну нравится, и слава Б-гу! Никто никого пинать ни для приличия, ни по каким -либо другим причинам не собирался и не собирается. У нас вообще это не принято. Да и сам не обидел никого, тоже. С чего бы вдруг? Высказал свою точку зрения, как я понимаю, создатель программы, или человек, разрабатывающий прогу дальше, улучшающий ее -естессно, что ему она нравится... Пропиарил, сделал бесплатную рекламу Николаю- да кто ж на это купится... smile.gif

Автор: rater 12.10.2006 - 22:33:28
Nata
Ну во-первых я сина сомниваюсь, что это создатель программы...
Во-вторых я тоже прошел через неё и от дальнейшего прослушивания меня удерживает только наличие достаточно разнообразных аудиокниг... Слушается она действительно вполне приемлемо и книг, в отличие от Заборовского, не портит...
В исполнении Николая я прослушал и весь архипелаг Гулаг и нужно ещё посмотреть какая версия лучше николаевская или та что сейчас у нас раздаётся...
Цитата (greyspid @ 9.10.2006 - 05:57)

Прочитайте лучше, может тогда получите право ругать такого мастера.

мастер он или не мастер это уж я сам услышу, без дополнительного чтения, где мне расскажут какой он мастер и почему...
Филипп Киркоров вон тоже мастер, но так простите далеко не все могут это мастерство воспринимать...

Автор: Nata 12.10.2006 - 22:55:53
rater, да кто же спорит? Слушай Николая на здоровье. Каждому, как говорится, свое... Тебе- Николай, мне- Заборовский. smile.gif

Автор: VST 13.10.2006 - 12:12:17
Цитата (Digalo @ 12.10.2006 - 22:21)

Будете смеяться и тыкать пальцем( ну это право у Вас никто не отнимет)


Если я смеюсь, это не значит, что я отвергаю Дигало. Мне смешно, когда так читают исполнители аудиокниг. А это не одно и тоже. smile.gif
А к Заборовскому уже привык. Да и в голове остается, не его голос, а информация. tongue.gif
Сегодня мои выбор ето аудиокниги. Когда голосовои движок станет совершеннее, это будет не плохим дополнением. В любом случае, технологию стоит развивать newest/thumbsup.gif

Цитата (Nata @ 12.10.2006 - 23:54)

Филипп Киркоров вон тоже мастер, но так простите далеко не все могут это мастерство воспринимать...

rater newest/thumbsup.gif

Автор: Iudushka 14.10.2006 - 20:10:33
сообщение уважаемого товарища Digalo перенес. С большим уважением отношусь к вышеобозванному продукту, но манера изложения оратора мне крайне неприятна, особенно
Цитата (Digalo @ 12.10.2006 - 23:21)

P.P.P.S А вот ответов не будет,сказано все!

с большим трудом сдержался от удаления поста. У нас тут Клуб, а не доска объявлений

Автор: rater 14.10.2006 - 20:39:50
Iudushka
А я уж думал и куда всё подевалось... хорошо, что не удалил, а то бы я начал думать, что у меня голюцинации и ничего на самом деле и не было... blink.gif

Автор: nirko 15.11.2006 - 00:11:47
Iudushka , прочитал я этот пост и ничего нового для себя не открыл.
Я тоже пытался слушать и Николая , и Катерину - больше часа не выдерживал . Хоть и у меня аудио библиотека не маленькая и скачивается гораздо больше , чем прочитывается , но иногда хочется почитать - послушать , что то новенькое , популярное , то что ещё не озвучено и не скоро озвучат .
Хочу озвучить свои мысли и попросить уважаемую публику высказаться .
Я предлагаю озвучивать книгу любой программой и полученный файл (wav или mp3) обрабатывать программой , которая меняет голос , например AV Voice Changer или ей подобной .
Я читал ,что при помощи такой программы можно полностью изменить голос и даже подставив для сравнения голос - образец , можно говорить этим голосом и даже записать всё , что сказал в мр3 файл заданного качества .
Да, конечно придется много повозиться , но результат стоит того .
Ожидаю ваш вердикт .

Автор: greyspid 15.11.2006 - 04:50:05
Цитата
Я читал ,что при помощи такой программы можно полностью изменить голос и даже подставив для сравнения голос - образец , можно говорить этим голосом и даже записать всё , что сказал в мр3 файл заданного качества .

С тем же успехом можете воспользоваться любым морфкодером в саундфорже, да можно изменить тональность голоса Герасимова до Фаринелли, но толку - нуль, голос живей не станет, единственное насчет голосов-образцов, здесь не пробовал, но имхо там то же самое, тональность и все.....AV Voice Changer - весит не более 50 метров, а у программных комплексов модуляции голоса одних библиотек на гигабайты+ их еще и учить надо.

Автор: Iudushka 15.11.2006 - 19:23:03
Согласен. Смысла не вижу. Эффект будет примерно тем же, что от изменения скорости ивысоты звучания Николая прямо в синтезаторе.

Автор: nirko 15.11.2006 - 22:45:45
Я не стану спорить , но всё же хочу попробовать .
Почему многие наши эстрадные "звёзды" могут петь ,не обладая ни слухом ,ни голосом , а уважаемые НИКОЛАЙ не может читать голосом Герасимова .
Ведь всё это программная обработка звука , файла .Да это не просто без навыков , однако ещё не давно мы фотографировали на плёнку , а сейчас без дигитальной камеры и фотошопа мы уже себя не мыслим .И так во всём ,чего коснулся компьютер .

Автор: LKa48 15.11.2006 - 23:34:50
nirko
Послушайтесь моего совета: не тратьте время. Поверьте, в свое время я прожужжал уши наверное все форумчанам с примерно такими же идеями! Но качество у Николая/Катины настолько мерзкое, что это уже только могила может исправить. Да, сущестбуют великолепные аглицкие движки и голоса! но сравните: даже слабенький голос ( аглицкий) занимает примерно 600-700 М!!! а Коля наш?
Я уже не говорю о прогах (АТ&Т например).

Автор: greyspid 16.11.2006 - 05:18:21
Цитата
Я уже не говорю о прогах (АТ&Т например)

Согласен, ну неужели у наших коммерсантов нет нужды в синтезе речи? Ведь спрос рождает предложение, специально искал на софтуле стенды с синтезом, думал может просто нам движки не попадаются, не нашел ничего newest/dunno.gif

Автор: rater 18.11.2006 - 11:23:48
LKa48
Цитата (LKa48 @ 16.11.2006 - 00:33)

уже не говорю о прогах (АТ&Т например).

Ну ставил я эту АТиТ - хуже Николая, даром, что больше Гигабайта занимает. Вроде по описанию гигабайт израсходован на все возможные аллофоны, но по результатам этого не видно... Может в самых последних версиях что то уже достигнуто?
Так что дело выходит не в объёме.... newest/dunno.gif
Английский Даниэль звучит вполне прилично, можно слушать...
Катерина и в самом деле из-за своих сумашедших интонаций способна свести с ума..
А Николая вполне можно слушать, если содержание книги вызывает интерес. Недостатки движка уходят на второй план и их не замечаешь..


Автор: LKa48 18.11.2006 - 14:32:01
rater
Мы видимо как обычно говорим о совершенно разных вещах ( голосах в данном случае).
1. Какая разница сколько занимает места? Чего хард маленький? Размер в данном случае определяет словарь! В данном случае аглицкого языка. Слушать на нем русские книги? Наверное можно, но я не пробовал... Наверное будет бредово.
2. АТ&Т работает прекрасно, особенно последние версии. И сравнивать, например, Сrystal ( это голос такой) даже в старенькой версии 1.4 с незабвенным Колей это просто... newest/dunno.gif
А в прочем, я уже убедился, что вкусы ( и видимо слух тоже) некоторых наших товарищей резко отличаются от моего! Так что спор бесслысленный...

Автор: Parooz 18.11.2006 - 20:39:41
Digalo... Катерина...
Все это морально устаревшее, на пороге 2007-й. Пора появиться чему-нибудь и поновее. Неужели никто, ничего не слышал?

Автор: парус 19.11.2006 - 04:26:06
Цитата
Digalo... Катерина...
Все это морально устаревшее, на пороге 2007-й. Пора появиться чему-нибудь и поновее. Неужели никто, ничего не слышал?


А я уже пол года пользуюсь Катькой и ничего, привык.
Мне кажется лучшего и придумать нельзя, а если и придумают, то движек будет уже не 50 метров а значительно больше.

Автор: rater 22.11.2006 - 18:45:03
LKa48
Цитата (LKa48 @ 22.11.2006 - 02:28)

которые с пеной у рта доказывают "преимущества" Коли с Катей перед чтецами!

Преимущество всё ещё есть...
Вот скоро выйдей новая книга Акунина и мне её прочтёт Николай.
А старофиты будут ждать пока их любимые книжки кто то соблаговолит прочесть... Да ещё и так прочтёт, что хоть Николаю отдавай...

Автор: LKa48 23.11.2006 - 14:55:32
Цитата (rater @ 22.11.2006 - 12:44)

А старофиты будут ждать пока их любимые книжки кто то соблаговолит прочесть... Да ещё и так прочтёт, что хоть Николаю отдавай...

Да нет старофиты просто прочтут ( надеюсь Вы еще не забыли чтение??? :wink: ). Я могу только повторить: книг , чтобы слушать есть лет на 5 вперед и т.к. в метро я не езжу и слушаю только в машине, то пользоваться Колей, Катей да и Ковалевым тоже НЕ буду! А Ваше мнение это индивидуально! Поверьте те хлопоты и время на создание ниги ( для Акунина будет часа 4-5 сделать, порезать залить) и прослушать не стоят того: я за это время просто прочту...

Автор: afonya123 23.11.2006 - 17:15:17
Iudushka
VoiceText NeoSpeech движок это лучшее что есть на сегодня. Натуральный , естественный мужской и женский голос. Paul and Kate English-speaking voices.

Автор: Iudushka 23.11.2006 - 17:17:29
Цитата (afonya123 @ 23.11.2006 - 18:14)

English-speaking

т.е. мы тут все больше про по-русски. а вот про скринридеры - если вам есть чем поделиться - так и рассказали бы в отдельной теме - это нужно и важно

Автор: afonya123 23.11.2006 - 17:28:39
Iudushka
Я приношу свои извинения, к сожалению сайт kurzweiledu.com не очень информативный. Вот другой ресурс для приведенных синтезаторов речи
Код
http://www.digitalfuturesoft.com/neospeechvoices.php

Надеюсь это поможет всем. Загрузите демо и сравните.
К сожалению произошла задержка, меня подключат к скоростному интернету только через четыре дня. Пока мучаюсь и искользую дайл ап.Sorry

Автор: TrillerMan 31.12.2006 - 00:00:39
Код
http://websound.ru/soft-speech_r.htm

вот тута софт есть выбираем,тока николая последнего 5.1 я не нашёл,у когонить есть?может он действительно стал таким крутым?

Автор: slon32 31.12.2006 - 11:44:19
Цитата (TrillerMan @ 31.12.2006 - 00:59)
вот тута софт есть выбираем,тока николая последнего 5.1 я не нашёл,у когонить есть?может он действительно стал таким крутым?

Первая строчка:
Acapela TTS-движок с голосом Elan (русский) v5.1.0.0.-это и есть новый Николай 5.1. Сам скачивал и проверял. Разници в голосе между 4.2 и 5.1 версиями нет никакой.

Автор: TrillerMan 31.12.2006 - 12:04:34
ок спасибо.А катерина действительно такая истеричная алкоголичка? сейчас буду тестировать )))

Автор: XPhantom 31.12.2006 - 20:46:36
Цитата (TrillerMan @ 31.12.2006 - 13:03)
ок спасибо.А катерина действительно такая истеричная алкоголичка? сейчас буду тестировать )))

Ужасная... Как начнёт завывать...

Автор: ededed 31.12.2006 - 20:50:25
Цитата
Ужасная... Как начнёт завывать...

"То,как зверь,она завоет..."©

Автор: TrillerMan 31.12.2006 - 21:15:31
ну колян точно на дауна с махивает,так что надо катьку подёргать)))

Автор: TrillerMan 2.01.2007 - 23:05:18
Ужас,это такая алкоголичка которых свет не видовал)))После этого я стал коляна ценить))всё таки он получше
той алкоголичьки,хотя колян на дауна смахивает местами)))

Автор: XPhantom 2.03.2007 - 21:54:02
Случайно обнаружил:

Festival
Код
http://www.cstr.ed.ac.uk/projects/festival/


Подробнее на русском:
Код
http://linux.tiflocomp.ru/docs/ux_synths.php


Но это не так инетересно, если бы не:
Код
http://festlang.berlios.de/docu/doku.php?id=russianru


Пример кластерного синтеза:
Код
http://festlang.berlios.de/docu/lib/exe/fetch.php?id=russianru&cache=cache&media=examples:russian_cl.wav


Думаю, если автор не забросит работу над проектом, то можно ждать очень хороших результатов.. Даже сейчас этот синтезированные голос звучит очень неплохо, и мне кажется, что у проекта большое будущее. Жаль только что он не на винде.

Автор: king 4.03.2007 - 19:39:25
Цитата
Даже сейчас этот синтезированные голос звучит очень неплохо

А по-моему, даже с коляном рядом не стоит. А-ля Катерина, сырой вариант.

Автор: zeppelin 19.07.2007 - 22:35:13
недавно одну книгу прослушал с помощью Николая. при всех недостатках, дай бог ему здоровья. интеллигентный человек он, скромный, не то что некоторые попадаются...

Автор: korvinio 15.01.2008 - 23:24:21
Хотелось узнать у пользователей данного форума, может быть кто-нибудь слышал о хороших русских движках которые способны синтезировать голос с эмоциями? Все что из последнего я реально могу скачать тока Realspeak Katerina и Acapela Nicolai. Если кто знает движки посвежее пожалуйста пишите, даже если они платные...

Автор: WhiteRabbit 15.01.2008 - 23:33:19
Цитата (korvinio @ 16.01.2008 - 00:13)

кто-нибудь слышал о хороших русских движках которые способны синтезировать голос с эмоциями

Слышали. Что нет такого зверя в природе. dunno

Автор: NSS 16.01.2008 - 00:01:27
И в обозримом будущем не будет, а если повезёт, то гораздо дольше. Чтобы читать с эмоциями нужен как минимум интеллект которого нет даже у самого мощного американского суперкомпьютера. К счастью, тот принцип который мы сегодня имеем в компьютерах не допускает перехода в разум.

Автор: Etoja 16.01.2008 - 01:43:59
В принципе синтезатор для хорошего литературного чтения теоретически возможен - только, мне кажется, нужна специальная предварительная обработка текста, разметка эмоциональными значками. А работа по такой разметке потребует очень хорошего специалиста! Но все-таки это не будет настоящим художественным чтением.

Я тут заметил что происходит обратный процесс - появляется все больше чтецов читающих как компьютер, приходится иногда напрягаться чтобы выяснить человек это или машина B)

Автор: zeppelin 16.01.2008 - 14:34:44
Цитата
Хотелось узнать у пользователей данного форума, может быть кто-нибудь слышал о хороших русских движках которые способны синтезировать голос с эмоциями?

Насколько я знаю и Николай Говорилкин обладает долей эмоций. Например по разному читает восклицательные и вопросительные предложения, и я бы сказал неплохо у него это получается. Также умеет выделять некоторые междометия.

Автор: NSS 16.01.2008 - 14:53:13
Всё, что делает Николай, это копирует паузы на вдох-выдох, остальное достраивает мозг слушающего.

Автор: rater 16.01.2008 - 18:05:53
Цитата (NSS @ 16.01.2008 - 15:42)

остальное достраивает мозг слушающего.

Ну так на то он и мозх. Мы вот видим какие то значки "букавки" и достариваим их и никого это не возмущает. А на Николая чёта всё накидываются.

Не нравится вам Николай - не слушайте. Слушайте Игоря М. как он чаем горло полоскает.


Автор: Etoja 16.01.2008 - 19:27:48
Цитата (rater @ 16.01.2008 - 18:54)
Цитата (NSS @ 16.01.2008 - 15:42)

остальное достраивает мозг слушающего.

А на Николая чёта всё накидываются.

Эт, потому что он ответить не может... D

Автор: king 17.01.2008 - 10:33:18
Прослушал с николой с новым словарём + koobaudio Хейли "Аэропорт". Зачёт.

Автор: korvinio 18.01.2008 - 01:28:22
Я слышал про новые движки которые читают с интонацией, там тока теги нужно будет расставлять. Вот я думал, вы могли бы мне подсказать как же они называются, а то поисковиком сложно искать.

Автор: Etoja 18.01.2008 - 16:41:55
На английском можно посмотреть
Код
http://cepstral.com/demos/


Там можно в окошечке напечатать текст и он вам его обратно прочтет. Звучит очень неплохо для такого движка. Конечно, с ударениями там проблема тоже.

На русском, к сожалению, ничего не нашел.

Автор: NSS 18.01.2008 - 20:21:26
Цитата (Etoja @ 18.01.2008 - 17:30)

На английском можно посмотреть вот тут


слушать там лучше не предлагаемый текст, а любой другой. Читает не лучше Коли, до интонации очень далеко и те-же частотные провалы в словах, как при определённой болезни с провалившимся носом. )

Автор: vikkiv 18.01.2008 - 23:02:13
Вот тут нашёл хорошие голоса для Говорилок:
Примите во внимание что:
1) Это не готовые голоса а только SpeechPack без самого SAPI5 движка
Код
http://actor.loquendo.com/actordemo/default.asp

2) Прекрасно работают на движке от старых голосов (от qualisoftware / qualispeak) которые широко доступны в сетях (но низкого качества т.к. размер около 30~40Мб) + WarHammer патч. Просто возмите один из старых голосов поставте поверху + patch, и всё заработает.. или готовый вариант[/URL] (сам не проверял - корейские друзья собрали)
Код
http://my.dreamwiz.com/astone/Loquendo_TTS_Engine.exe
.
3) Установку производить в директорию X:/Program Files/Loquendo/LTTS/ (Где Х - ваш диск)
4) В большинстве голосов Loquendo работают эмоциональные тэги
Код
http://www.loquendo.com/en/demos/demo_tts.htm
http://actor.loquendo.com/actordemo/Gilded.htm

5) Для снятия лицензиионных ограничений NeoSpeech годится старый способ помещения файла censored в директорию ...\data-common\verify\ .
Код
Английский Neospeech
http://www.mediasemantics.com/neokate.exe — Kate1 (235MB)
http://www.adondo.net/Downloads/NeoSpeech_Kate_Setup.zip — Kate2 (230MB)
http://www.mediasemantics.com/neopaul.exe — Paul1 (235MB)
http://www.adondo.net/Downloads/NeoSpeech_Paul_Setup.zip — Paul2 (230MB)

Английский Loquendo
http://www.mediasemantics.com/loquendosimon.exe — Simon1 (275MB)
http://www.netsbrain.com/downloads/Simon_UK16_setup.exe — Simon2 (300MB)
http://www.mediasemantics.com/loquendokate.exe — Kate1 (290MB)
http://www.netsbrain.com/downloads/Kate_UK16_setup.exe — Kate2 (310MB)
http://www.mediasemantics.com/loquendosusan.exe — Susan (230MB)
http://www.mediasemantics.com/loquendodave.exe — Dave (270MB)
http://www.netsbrain.com/downloads/Elizabeth_UK16_setup.exe — Elizabeth (182MB)

Испанский Loquendo
http://www.mediasemantics.com/loquendocarlos.exe — Carlos (230MB)
http://www.mediasemantics.com/loquendocarmen.exe — Carmen (185MB)
http://www.mediasemantics.com/loquendojorge.exe — Jorge (170MB)

Португальский Loquendo
http://www.mediasemantics.com/loquendogabriela.exe — Gabriela (235MB)

Шведский Loquendo
http://www.mediasemantics.com/loquendoannika.exe — Annika (415MB)

Греческий Loquendo
http://www.mediasemantics.com/loquendoafroditi.exe — Afroditi (182MB)

Французкий Loquendo
http://www.mediasemantics.com/loquendobernard.exe — Bernard1 (157MB)
http://www.netsbrain.com/downloads/Bernard_FR16_setup.exe — Bernard2 (170MB)
http://www.mediasemantics.com/loquendojuliette.exe — Juliette1 (220MB)
http://www.netsbrain.com/downloads/Juliette_FR16_setup.exe — Juliette2 (230MB)

Немецкий Loquendo
http://www.mediasemantics.com/loquendostefan.exe — Stefan (260MB)
http://www.mediasemantics.com/loquendokatrin.exe — Katrin (275MB)

Итальянский Loquendo
http://www.mediasemantics.com/loquendoluca.exe — Luca (200MB)
http://www.mediasemantics.com/loquendopaola.exe — Paola (200MB)

Датцкий Loquendo
http://www.mediasemantics.com/loquendowillem.exe — Willem (270MB)
http://www.mediasemantics.com/loquendosaskia.exe — Saskia (265MB)

Японский Neospeech
http://www.mediasemantics.com/neoshow.exe — Show (646MB)
http://www.mediasemantics.com/neomisaki.exe — Misaki (530MB)

Китайский Neospeech
http://www.mediasemantics.com/neowang.exe — Wang (203MB)
http://www.mediasemantics.com/neolily.exe — Lily (520MB)

Сервера для скачивания все легальные.


......

Вот ещё забыл - партия TTS движков с легальных серверов:
Код
http://www.flamespeech.com/

Tам в разделе "Voices" можно найти голоса от
Код
АТ&T:
http://www.research.att.com/~ttsweb/tts/demo.php
NeoSpeech:
http://www.neospeech.com/


Код
Японский
http://www.flamespeech.com/Voices/NeoSpeech/Miyu33489711/MiyuSetup.exe — Miyu 430MB
http://www.flamespeech.com/Voices/NeoSpeech/Show91546238/ShowSetup.exe — Show 625MB

Корейский
http://www.flamespeech.com/Voices/NeoSpeech/Yumi64857935/YumiSetup.exe — Yumi 535MB
http://www.flamespeech.com/Voices/NeoSpeech/Junwoo81793556/JunwooSetup.exe — JunWoo 360MB

Французкий
http://www.flamespeech.com/Voices/ATT/Juliette827459346/JulietteSetup.exe — Juliette 645MB
http://www.flamespeech.com/Voices/ATT/Alain59714639/AlainSetup.exe — Alain 640MB

Английский
http://www.flamespeech.com/Voices/ATT/Audrey34785196/AudreySetup.exe — Audrey 720MB
http://www.flamespeech.com/Voices/ATT/Charles254198763/CharlesSetup.exe — Charles 740MB
http://www.flamespeech.com/Voices/ATT/Claire175436982/ClaireSetup.exe — Claire 575MB
http://www.flamespeech.com/Voices/ATT/Crystal41736592/CrystalSetup.exe — Crystal 575MB
http://www.flamespeech.com/Voices/ATT/Julia649358216/JuliaSetup.exe — Julia 600MB
http://www.flamespeech.com/Voices/ATT/Lauren234968125/LaurenSetup.exe — Lauren 880MB
http://www.flamespeech.com/Voices/ATT/Mel693568724/MelSetup.exe — Mel 525MB
http://www.flamespeech.com/Voices/ATT/Mike534986712/MikeSetup.exe — Mike 600MB
http://www.flamespeech.com/Voices/ATT/Ray984759361/RaySetup.exe — Ray 580MB
http://www.flamespeech.com/Voices/ATT/Rich714859359/RichSetup.exe — Rich 425MB
http://www.flamespeech.com/Voices/NeoSpeech/Kate34978216/KateSetup.exe — Kate 230MB
http://www.flamespeech.com/Voices/NeoSpeech/Paul59872643/PaulSetup.exe — Paul 230MB

Немецкий
http://www.flamespeech.com/Voices/ATT/Klara054126973/KlaraSetup.exe — Klara 620MB
http://www.flamespeech.com/Voices/ATT/Reiner762938415/ReinerSetup.exe — Reiner 700MB

Испанский
http://www.flamespeech.com/Voices/ATT/Rosa018479635/RosaSetup.exe — Rosa 715MB
http://www.flamespeech.com/Voices/ATT/Alberto93698547/AlbertoSetup.exe — Alberto 690MB


Для установки голосов АТТ в очень редких случаях необходимо установить движок
Код
http://nextupdownloads.com/ATTEngOnly.exe
(Не ставте если и так всё работает).

Бонус - Арабский язык
Код
http://fransclemaire.be/dwnl/ivx/acapela_arabic.zip
два голоса Salma/Nawfal демо-30 дней
.

НИКАКОГО ВАРЕЗА!

Автор: Parooz 23.01.2008 - 22:20:43
Голосов то много, а вот русских по прежнему нет...
Похоже мы с Дигало еще будем лет десять жить...
Досадно!

Автор: vikkiv 25.01.2008 - 08:52:47
В том регионе качественные движки выпускает местная компания NeoSpeech (ранее корейская VoiceWare) - которую сейчас перекупила Pentax - (2 голоса) - У нас на местном рынке довольно много вариантов выпустила Сакрамент (хотя качество отстаёт - это не считая голосов типа Иван-Tigrix, MicroSoft и MagicGooddy). Голоса по-хуже выпускает Nuance - США (2 голоса - но для нас они тоже кое-что произвели - Катю) и Loquendo - Европа (1 голос - на что для России руский язык выпустила Acapela-Group - голос Николай). В общем на мой взгляд предложение вполне сбалансированно - особенно если принять во внимание скорость роста рынков платёжеспособность и риски (в сумме рентабельность).

Автор: rater 25.01.2008 - 19:19:41
vikkiv
Спасибо за движки.

Вот попробовал пока один установить.
Цитата (vikkiv @ 19.01.2008 - 00:01)

Loquendo
Stefan (260MB)

ICE Book Reader его видит. Но не читает.

Нельзя ли поподробнее рассказать где эти голоса работают. В каких программах тестировали их вы.

Автор: vikkiv 25.01.2008 - 20:03:00
1) А в Speech Panel он говорит (Control Panel -> Speech)?
2) Установил только SpeechPack или движок тоже?

После инсталляции файлы с расширением "dll" (LoqTTS6.dll; loqsapi5.dll;LoqTTS6_util.dll....) должны находится в директории "...\Program Files\Loquendo\LTTS" , там-же должны оказатся директории типа "EnglishGb", "EnglishUs", "German"... - в зависимости от установленного языка.
Я лично сам ставил через голоса Qualispeak которые можно найти в Emule.

Добавлено
Ааа.... если использовал лёгкий вариант (Собранный нашими корейскими друзьями) то там всё надо ставить в директории по умолчанию (...\Program Files\Loquendo) - без всяких ...\LTTS. !!!

Автор: afonya123 10.04.2008 - 17:42:58
Напрасно ругаетесь. Нет ещё звукового движка для РУССКОГО ЯЗЫКА, чтобы сравнился с чтецом. wink
Что до английского, читайте всю ветку,я давал ссылки на семплы и сайты производителей софта. Движки от Voice Text Neo Speech читают лучше чем некоторые профессиональные актеры. Надо отдать должное разработчикам, они выбирали нейтральные голоса. Думаю отбор проходил по принципу дикторов на ТВ и Радио, чтобы не раздаражали аудиторию.
Но убежден , что притензий к роботу будет всегда меньше. Актеры очень часто переигрывают. Кроме того здесь субъективный фактор предпочтения.Есть ряд книг которые по определению нельзя озвучивать актерам.Философия, история, психология, бизнес, религия, юридическая литература,научно-популярная, фундаментальные научные издания, энциклопедии, искусство, все лекции.IMHO здесь приоритет выбора за нейтральным голосом, ибо повыщенная экспрессия и экзальтация только мешает.
Приучить людей слушать робота очень просто.Ну а театральная аудио постановка это уже другой жанр аудиокниги. Между этими двумя направлениями даже нет конкуренции в обозримом будующем. Они будут развиваться параллельно и независимо друг от друга.
Так что спещу огорчить кролика, профессия непрофессиональных чтецов и самодеятельность в индустрии аудикниг исчезнут скоро. Вымрут как мамонты.
Проги распознающие человеческий голос пока ещё ооооочень далеки от прогресса. Но это уже тема для другого топика. sdvig

Автор: FRANK49 2.05.2008 - 08:44:27
Цитата
(представляю как веселятся сейчас противники машинного чтения, читая тему


Каждому-своё! D Главное не пытаться навязать свое мнение. Давайте будем делиться своими успехами и уважать каждое мнение! ) А заинтересованные будут пробовать, и успехов всем! D

slag!
Подскажите, пожалуйста, как правильно вставить движок
Acapela-Elan-TTS-SpeechCube-5.1-RUSNicolai_MmE255_.msi

Автор: king 8.06.2008 - 12:36:00
korvinio
Вот ещё для затравки голос фестиваль:
Код
http://nshmyrev.narod.ru/temp/example2.wav
Правда, автор вручную размечал текст )
LKa48
Центр Речевых Технологий из Санкт-Петербурга, а катя вообще импортная.

Автор: LKa48 8.06.2008 - 12:38:00
Цитата (king @ 13.06.2008 - 10:32)

катя вообще импортная

это я знаю!
Просто давно назад у нас же кто-то не помню кто рекламировал именно Минский продукт с Катей! Искали долго и упорно. В итоге оказалось - зря... dunno

Автор: slag 8.06.2008 - 15:19:00
Цитата (king @ 13.06.2008 - 17:32)
Вот ещё для затравки

По ссылке выдает 404.

Вот что удалось найти по Festival.
Голосовой движок и несколько голосов под Unix системы.
Разработчик The Festival Speech Synthesis System University of Edinburgh
Код
http://www.cstr.ed.ac.uk/projects/festival/

Русский в Festival
Код
http://festlang.berlios.de/docu/doku.php?id=russianru

Пример заслуживающий внимания-кластерный синтез с помощью базы urp http://www.mediafire.com/?wdodboddx4i
Русский голос
Код
http://download.berlios.de/festlang/msu_ru_nsh_clunits-0.4.tar.gz

Движок
Код
http://www.speech.cs.cmu.edu/awb/fftest/speech_tools-1.2.96-beta.tar.gz
http://www.speech.cs.cmu.edu/awb/fftest/festival-1.96-beta.tar.gz
- нужны оба
http://bedwyr-redhat.bangor.ac.uk/svn/repos/WISPR/Documentation/Papers/Interspeech2006/festival_windows.pdf


Под винду наверно компильнуть не получится,а вот под Linux можно попробовать.Заинтересовало.

Автор: korvinio 8.06.2008 - 20:30:00
Цитата
Под win использовать, скачав:
Код
http://www.cs.dal.ca/~lalita/festival/win32/festival_1.95-beta_win32.zip


Полное руководство по сборке тут:
Код
http://flame.cs.dal.ca/~lalita/festival/festivalXP.htm


Просьба скачать --- голосовой файл
Код
http://download.berlios.de/festlang/msu_ru_nsh_clunits-0.4.tar.gz
и залить на файлообменники с докачкой.

P.S. Да и голос получше чем на движках стандарных под Win


Взято из:
Код
http://hire7.net/forum/archive/index.php?t-1443.html


Пожалуйста, залейти голос на файлообменники с докачкой, а то у меня не успевает скачать как инет может может даже на секунду вырубиться. Можно на megaupload, ifolder, yandex... Буду премного благодарен.

Автор: slag 8.06.2008 - 21:27:00
Цитата (korvinio @ 16.06.2008 - 02:52)

Пожалуйста, залейти голос на файлообменники с докачкой...

http://narod.ru/disk/932505000/msu_ru_nsh_clunits-0.4.tar.gz.html
http://www.megaupload.com/?d=C5092XGH
185 мб

В приведенной ссылке руководcтва по компиляции под винду рассматривается версия festival 1.95(материал двухлетней давности).Разработчик русского голоса рекомендует использовать версию 1.96.Поэтому любое несоответсвие необходимых библиотек приведет к отрицательному результату.Слишком это хлопотное дело,поэтому я думаю тратить время не стоит.Ставить Linux confused (это хорошо у кого он уже стоит),к тому же нет точной инфы под какие именно дистры заточен(по идее должен пойти под большинство).Надо попробовать под liveLinux(опять же могут отсуствовать необходимые либы).Тут надо время,очерь большое желание и немного умения(или так время,очень большое умение и немного желания).

Автор: korvinio 8.06.2008 - 22:02:00
Хе, я себе cygwin ставлю и на нем буду кампилить. Т.к. с linux-ом дело уже имел - проблем не должно быть. Тебе тоже рекомендую сygwin. Также мона andlinux или ulteo. Все это работает на винде.

Автор: alf082 9.06.2008 - 21:57:00
а че говорить самый классный КОЛЯ

Автор: xyzxyz 12.07.2008 - 16:48:34
Предлагаю Вам прослушать варианты чтения, по моему лучшими на данное время, тремя движками:
Linux-Festival, Ктерина и Николай...

...на мой взгляд наиболее хороший голос у Катерины (но вот проблема с записью в *.wav - в "Балаболке" - посторонние шумы, а так читает чисто)

ссылка на мой пример:
http://depositfiles.com/files/6539818

ссылка на Linux голос:
Код
http://festlang.berlios.de/docu/lib/exe/fetch.php?id=russianru&cache=cache&media=examples:russian_cl_urp.wav


...да ещё для того чтоб "катя" так читала (хорошо) с неё надо снять ограничения по скорости и тогда она исправляется и перестаёт быть истеричной алкоголичкой D
(в архиве также вложил файл с инструкцией по курсу её реабилитации и терапии...

или вот сцилка на терапию:
censored

или с сайта Балоболки:
censored

не вижу смысла в такой информации. балаболки и иже с ними (особенно mp3book)- попытка вытянуть деньги за несовершенный продукт. голосовых движков приемлемых на сегодня 2 - катерина и Николай. кто из них лучше - спор праздный. да еще + speech api новый - программа - лишь интерфейс. а ссылок на "терапию" не нужно уж точно

Автор: korvinio 13.07.2008 - 11:52:21
Я не знаю, но вроде нету управы на Катю (словаря). Так бы для некоторых текстов выбирал бы Катю.
А чтобы снять истеричность надо просто скорость уметь настраивать ), тогда и разные reg файлы не нужно качать.

Автор: rrssrr 16.07.2008 - 21:15:54
Acapela выпустила новые голоса и русский Алена в том числе
Код
http://www.acapela-group.com/download-infovox-desktop-text-to-speech-demo.html

Автор: slag 16.07.2008 - 21:56:41
Вот приятное известие.
Голосок,то наш Аленкин,совсем новый(от июля сего года).
Сейчас качаю,ставлю,пробую и отписываюсь,что почем.

******************************************************
Добавлено позже:
http://www.mediafire.com/?dmyesh25gmy - все установки по умолчанию,из текста удалены кавычки и тире.
Первое впечатление неоднозначное,уже нашел несколько не очень приятных моментов.Но главное до идеального звучания,доводить надо будет вручную,ну может поменьше,чем с николаем.

Автор: slag 17.07.2008 - 03:02:50
Infovox Desktop PRO
голосовой движок от компании Acapela.
[22.3 мб]
30-ти дневная триал версия,без ограничений.
Infovox Desktop V2.210 Service Pack 1.
требуется для работы русского голоса.
[785 кб]
Русский голос Алёна.
[149 мб]
Установка не вызывает никаких затруднений,в процессе устанавливаются SAPI4 и SAPI5.1
Имеется:
1.Простенькая программа для прослушивания текстов(записи в mp3,wav нет)
Infovox Desktop SpeechPad,работает с движком только под SAPI4.
user posted image

2.Панель(окно) настроек Voice Manager,
изменяются и влияют настройки,только если работаете в Infovox Desktop SpeechPad.Если работаете со сторонними программами,будут доступны,только настройки имеющиеся в этих программах и то еще вопрос,как они адаптированы к этому движку.
user posted image
user posted image
user posted image
user posted image
user posted image

3.Самое наверно интересное это -Lexicon Manager
инструмент создания,редактирования и подключения пользовательских словарей.
user posted image
user posted image
user posted image

Теперь немного о работе.
Установленная у меня Балаболка без проблем подхватила Алену и под SAPI4,и под SAPI5.
Однако под SAPI4,Алена читать отказалась,выдав ошибку-Floating point division by zero.
Под SAPI5 никаких проблем,как при чтении,так и при записи в mp3 или wav не наблюдалось.

Теперь по поводу воспроизведения(первые впечатления),что не понравилось:
1.Так же,как и с Николаем,надо готовить текст,потому,что некоторые слова,например в кавычках,бывает произносятся не правильно,после удаления их(кавычек) всё приходит в норму.
2.Немного проглатываются окончания слов(вероятно это можно настройть(скорость чтения,паузы т.д.,надо глубже разбираться)
3.Читаются тире(править пользовательским словарём)

Как читаются большинство названий (т.е. собственные имена) покажет дальнейшее использования.
А вот по поводу омографов,даже в руководстве прописали,что это языковая фича и надо смирится.
7.3 Lexical accent
Lexical accent indicates the level of prominence (or emphasis) of a syllable in a word.In Russian,
some words can be differentiated by the position of this exical accent.For example, the word
“замок” can either mean “a castle” or a “slot” depending on the position the lexical accent in the
word (a castle: /z A1 m @ k / or a slot: /z V m o1 k /).Practically all words in Russian have a lexical
accent even if it does not always serve to differentiate between two different words.It is therefore
important to include lexical accent marks when writing phonetic transcriptions.

Общее первое впечатление положительное.Но конечно надо побольше поюзать.

http://rapidshare.com/files/131738402/Speech_Alyona22k.zip.html handup

Автор: king 17.07.2008 - 10:37:23
Первое впечатление от образца голоса Алёны: )
1) Катерине всё-таки дали пару раз по черепушке, и она стала говорить менее истерично.
2)В команде разработчиков Алёны нет живых носителей великого и могучего.
3) Можно было бы просто скопировать метод интонирования у Николая.
4) Увы, у девушек всё та же горячая каша во рту.

Автор: Iudushka 17.07.2008 - 12:37:09
Цитата (king @ 17.07.2008 - 12:31)

Увы, у девушек всё та же горячая каша во рту.

согласен. продолжаю оставаться на Николае. Любопытно, а отчего они делают женские голоса?

Автор: king 17.07.2008 - 16:25:39
Цитата (Iudushka @ 17.07.2008 - 14:31)

отчего они делают женские голоса?

Феминизм. Причём создают голос методом тыка, авось получится. Интересно, что Бог создал женщину тоже не с первой попытки. )

Автор: balabolka 17.07.2008 - 20:22:07
Спасибо за информацию о новом русском голосе. Скачал, проверил в "Балаболке" работу через SAPI4 - да, действительно, какая-то ерунда. Не работает даже команда Skip, чтобы перейти на голос "Alyona SAPI4" (у меня установлено свыше тридцати голосов SAPI4, но с таким сталкиваюсь впервые); голоса приходится перебирать по одному, пока программа не доберется до "Алены". (

Текст "Alyona SAPI4" то читает, то нет; какие-то отдельные слова произносит, все остальные слова отказывается читать напрочь. После этого память программы забита "мусором", отсюда и сообщения об ошибках. Могу лишь "спрятать" все эти сообщения об ошибках от пользователя, но заставить "Алену" работать через SAPI4, похоже, не удастся.

Все равно, это праздник, друзья, - новый русский синтезатор речи, да еще с таким приличным звучанием! Дождались! )

Автор: Вика2 17.07.2008 - 20:26:56
Я от Аленки чегой-то в восторг не пришла dunno
Пока останусь верна "любимому мжчине" - Николаю )

Автор: balabolka 22.07.2008 - 18:52:01
Возвращаясь к проблеме "Алены" и SAPI4: скачал с сайта Acapela Group немецкий голос Klaus - он работает через SAPI4 нормально, никаких ошибок не возникает (как и через SAPI5). Следовательно, ошибка кроется где-то внутри "Алены"; будем надеяться, что в будущем разработчики голоса всё исправят.

Автор: slag 22.07.2008 - 23:51:36
Я им отправил в суппот такую писулю,интересно ответят или нет.

Hello.
I have loaded for testing InfovoxDesktop2_210Engine.exe+IDSP_100.exe+[Russian]Alyona22k_ID22.exe,
and I have a following problem. In yours SpeechPad under SAPI4 all works normally, but because,there is no support of records the text in a sound file,I has tried to use another programs supporting SAPI4 and working with another SAPI4 TTS voice without problems. However at start of reading Alyona(Russian)SAPI4 22kHz(without record, only reading),I have program mistake-Floating point divizion by zero. I had been tested some such programs, but in all was a similar mistake.After it I have loaded German HQ TTS Klaus(Male) and it works in these programs without mistakes.Are where any reasons of similar behaviour your program(Alyona[Russian]SAPI4 22kHz)known to you.Thanks.

Yours faithfully,

Автор: zeppelin 23.07.2008 - 00:30:28
послушал Алену, ИМХО, очень даже неплохо, хотя пока буду придерживаться Николая

Автор: slag 23.07.2008 - 00:35:12
Да,пока наверно единственное,что будет сдерживать от более плотного использования нового голоcа Алена,это сравнительная трудность создания и редактирования пользовательскиз словарей.Ну и дело привычки,конечно же.

Автор: zeppelin 23.07.2008 - 00:38:12
кстати, а где можно достать последнюю версию Николая и нормальный словарь к нему? что то я запутался в дебрях интернета -(

Автор: slag 23.07.2008 - 00:43:06
А ты какой "говорилкой" пользуешься.У меня хорошая подборка словарей адаптированных для Балаболки.

Автор: zeppelin 23.07.2008 - 00:48:47
2.0.6

Автор: slag 23.07.2008 - 00:57:57
Я так понимаю это Говорилка v.2.0.6
Тогда http://abook-club.ru/forum/index.php?showpost=188914 вполне подойдет словарик.
Добавлено: [mergetime]1216768979[/mergetime]
zeppelin
Посмотрите пожалуйста свою PM.

Автор: slag 23.07.2008 - 19:56:29
Получил ответ из Acapela.
Mr.,
Thank you for your interest in our products.
In order to advise you the best way, could you give me more details about your application?
Do you need to generate wav?
Can you tell me in which application you have had "program mistake-floating point division by zero"?
Regards,
Nancy Monie
Sales Support
Acapela Group

Я решил еще разок прошерстить все "говорилки"
(поддерживающие SAPI4) на предмет работы с Аленой под SAPI4.

Не работают :
Говорилка v2.0.6
TextAloud v.2.285
Балаболка v.1.18.0.322
Ice Book Reader Pro v8.9.2

Работают!!!:
AudioBook v1.4.2 (автор обновил программу и на сайте
написано,что поддерживается новая Алена,при этом
в системе должен быть установлен netframework не ниже 2 и
необходимо зарегистрировать TTSObj.dll с помощью regsvr32.exe)
Сoolreader v2.00.51a (это старинная версия,в которой еще
была опция чтения текста при помощи голосовых движков).
Вот это меня очень удивило!?Может быть помогла регистрация
вышеупомянутой библиотеки?

Итог таков-Аленка работает под SAPI4 со сторонними программами,все дело в оптимизации программ под движок.
Отпишушь в Acapela,с извинениями,что зря поднял панику.
И еще одно наблюдение,если я предпочитал слушать Николая под SAPI4,то здесь противоположный результат,Аленка,
как мне кажится лучше "воркует" под SAPI5.

Автор: Iudushka 24.07.2008 - 07:57:30
Цитата (slag @ 23.07.2008 - 21:50)

если я предпочитал слушать Николая под SAPI4

а почему? 4 не дает ведь проводить ускоренную запись в файл, а разницы в звуке особой нет.

Автор: slag 24.07.2008 - 08:23:36
Цитата (Iudushka @ 24.07.2008 - 09:51)

а почему? 4 не дает ведь проводить ускоренную запись в файл, а разницы в звуке особой нет.


Уже задавили здесь этот вопрос.
Связка Балаболка+Nicolai_MmE255(последний)позволяет и под SAPI4 очень быстро
писать(600кб текст~6 мин в wav)
http://abook-club.ru/forum/index.php?showpost=168906
http://abook-club.ru/forum/index.php?showpost=168935
А по поводу разницы,мне лично кажется,что под SAPI5 Николай как то,более отрывисто читает.

Автор: Iudushka 24.07.2008 - 08:30:54
Цитата (slag @ 24.07.2008 - 10:17)

Связка Балаболка+Nicolai_MmE255(последний)позволяет и под SAPI4 очень быстро

последний николай прекрасно пашет в ускоренном виде и в другом софте, хотя предпочитает (по разработчикам все ж 5) я грешным делом пропустил указанные реплики, но в скорости четверка проигрывает пятерке совершенно точно ( на говорилку вообще последний николай не ложится у меня с четверкой - часто выскакивают ошибки, я делал на aldo`s text to wave)

Автор: slag 24.07.2008 - 09:06:20
Да я никогда и не спорил,что под 5 работает быстрее,просто указанную выше мною связку,я "заточил" под себя,т.е. определенным образом построил словари и привязал их к имеющейся функции поиска и редактирования омографоф.К тому же под 5 доп. словари не работают,т.е. используется только exc_rus.txt.А под 4 я использую еще 4 дополнительных словаря.Ну а 6-10 минут в wav меня вполне устраивают.

Автор: balabolka 24.07.2008 - 11:36:45
Цитата (slag @ 23.07.2008 - 21:50)

Итог таков-Аленка работает под SAPI4 со сторонними программами, все дело в оптимизации программ под движок. Отпишушь в Acapela, с извинениями, что зря поднял панику.

Если ЧЕТЫРЕ имеющихся у Вас программы не работают с Алёной через SAPI4 (а таких программ, уверяю Вас, намного больше) - по-моему, это как раз повод "поднять панику". Никакая "оптимизация программ под движок" тут не поможет; программы обращаются к голосам через определенный интерфейс, а уже дело голоса, как именно реагировать на команды, поступающие из речевых программ.

Перечисленные Вами четыре программы (и моя "Балаболка" в том числе) работают с SAPI4 через НИЗКОУРОВНЕВЫЙ интерфейс. Об этом можно прочесть подробнее на сайте Дениса Буторина
Код
http://subritto.h1.ru/msagent/speechapi.php
автора книги "MS Agent и Speech API для Delphi" (моя настольная книга ) ). Я утверждаю, что "Алёна" неправильно работает с SAPI4 через низкоуровневый (COM) интерфейс - в отличие от старых голосов Acapela Group, например, немецкого Klaus'a. И это невозможно "исправить" в "Балаболке": придется использовать другой интерфейс доступа к голосу, что означает - переписать программу заново (и это не потому, что программа плохая, а потому, что в одном-единственном голосе есть ошибка в работе с SAPI4!).

Программа "Audiobook" использует готовый компонент для работы с компьютерными голосами; это Active TTS Component
Код
http://www.guangmingsoft.net/activetts/
производства фирмы "Guangming Software". Какой интерфейс доступа к SAPI4 там используется - неизвестно; сам компонент представляет собой одну библиотеку TTSObj.dll. То, что программисты из "Guangming Software" не стокнулись с этой ошибкой в "Алёне", - что ж, честь им и хвала (полагаю, это просто везение).

Резюмирую: если хотите продолжать переписку со службой тех. поддержки Acapela Group, то сообщите им, что Алёна отказывается работать через "low-level programming interfaces in Microsoft Speech API 4.0 (SAPI 4)". На английском языке это все описано здесь:
Код
http://dn.codegear.com/article/29582
Там есть примеры программ на Delphi, в которых "Алёна" как раз и не работает.

Прошу прощения за возможный резкий тон своего поста, но мне досадно, когда на меня пытаются "повесить" ошибки в чужих программных продуктах.

Автор: slag 24.07.2008 - 12:07:29
Илья,да упаси бог,я никак не хотел никого обидеть,а тем более обвинить в чем либо и заставлять что-то переписывать под один голос.
Из моих и ваших постов,следует только одно,что программы написанные под Delphi и работающие через низкоуровневый интерфейс под 4 с Аленой не работают.
Вот и всё!
по поводу переписки с Acapela я обязательно сообщу об- "что Алёна отказывается работать через "low-level programming interfaces in Microsoft Speech API 4.0 (SAPI 4)"
Спасибо вам за внятные разъяснения.
К тому же я уже говорил,что большой необходимости в 4 для Алены нет,т.к. все-таки лучше она идет под 5.

Автор: balabolka 24.07.2008 - 12:46:18
Цитата (slag @ 24.07.2008 - 14:01)

по поводу переписки с Acapela я обязательно сообщу об- "что Алёна отказывается работать через "low-level programming interfaces in Microsoft Speech API 4.0 (SAPI 4)"


Никаких обид. )

Через низкоуровневый интерфейс с "Алёной" не будут работать не только программы, написаннные на Delphi, но и на других языках программирования (C++, VB). Delphi упомянут только лишь потому, что именно на этом языке я пишу. В общем, дело и не в языке программирования, а в ошибке при работе через низкоуровневый интерфейс - вот что я хотел подчеркнуть.

Буду качать и два других новых голоса от Acapela Group (польский и чешский), чтобы проверить как они работают с SAPI4. Сдается мне, что это только наши соотечественники-программисты "начудили", когда их наняли разрабатывать "Алёну".

Сообщить об ошибке в службу тех. поддержки Acapela Group - это очень правильное решение; я и не догадался до такой очевидной вещи. Спасибо Вам за настойчивость!

Автор: balabolka 24.07.2008 - 17:34:02
Скачал и проверил два новых голоса от Acapela Group (Czech Eliska и Polish Anja), а также один старый (Italian Chiara): старый голос работает через SAPI4 нормально, новые голоса выдают сообщение об ошибке - такое же, как "Алёна".

Через интерфейс высокого уровня все голоса работают с SAPI4 безошибочно. Но, естественно, никто не будет сейчас переписывать программу из-за этих ошибок в "Алёне", "Элишке" и "Ане"; это слишком большой труд - проще исправить ошибку в самом голосе.

Интерфейс высокого уровня проще в применении, чем интерфейс низкого уровня, однако, и менее гибок. Именно поэтому авторы программ "TextAloud", "2nd Speech Center", "Говорилка", "Балаболка" предпочли использовать интерфейс низкого уровня в своих программных продуктах.

В общем-то, ничего страшного: надо использовать SAPI 5 и ждать, когда Acapela Group исправит ошибку.

Автор: korvinio 25.07.2008 - 00:44:18
Я в шоке, даже не верится что появился движек такого уровня. Спасибо за новость друзья. Давайте теперь потроху разбираться в ней, кто что полезное разузнает - делитесь информацией ).

Автор: Iudushka 25.07.2008 - 10:12:43
korvinio
простите, не понял восторгов. а что такого запредельно хорошего появилось? Николая натурально как был последние лет 7, так и остается лучшим, хотя появление новых голосов отрадно, но принципиальные изменения в этой области касались пока только появления speech api 5

Автор: korvinio 25.07.2008 - 17:20:19
Ну знаете, я разницу по примеру очень сильную увидел. Самое важное что доработали - интонации человеческие. Даже те кто плохо слышат, сразу бы почувствовали. А после обработки текста, вообще шикарно должно быть. Николай, конечно же, в стороне по качеству.

Автор: korvinio 26.07.2008 - 17:30:35
Ещё раз выложу ссылки на Аленку, чтобы долго не искали, качайте с любого из двух зеркал:

http://narod.ru/disk/1675492000/Speech_Alyona22k.zip.html

http://rapidshare.com/files/131738402/Speech_Alyona22k.zip.html

P.S. Спасибо огромное slag, за то что перезалил на yandex.

Автор: korvinio 29.07.2008 - 01:51:30
Попользовался Аленой и вернулся на Николая (
Народ, спасибо за словарь к Николаю handup

Автор: oncologyst 6.08.2008 - 10:37:26
нормально Алена работает. Проблема только в прользовательских словарях. Отказала только TomReader. Любит SAPI4. IceBookReader 8.10 менее капризен, но более неграмотен. Под Вистой сижу.

Автор: zeppelin 6.08.2008 - 13:03:42
Цитата (oncologyst @ 6.08.2008 - 12:18)

нормально Алена работает. Проблема только в прользовательских словарях.

да, говорит нормально, но как иностранка D

Автор: Ajaja 7.08.2008 - 22:58:38
Quester
Цитата
Во втором случае имеем дело с "побитовой" предачей информации(с помощью речи) Основной критерий качества здесь - ясное, четкое донесение этой самой информации, все остальное читатель сам расцветит эмоционально, в случае нужды(так же как и с печатными буковками).

+1
Абсолютно согласен. Добавлю, что в синтезе еще важна (во всяком случае для меня) не только четкость, но скорость передачи информации без потери этой самой четкости. А Николай с его 16KHz в этом очень сильно отстает от Катерины и Алены. Последних, после небольшой адаптации, вполне можно слушать на скоростях >300 слов в минуту. Кстати, в случае чтения глазами, это уже считается ускоренным чтением ;)

Автор: LonliLokli 8.08.2008 - 23:25:49
Тут проглядев немного эту ветку, прочитал, что типа иностранные движки на порядок лучше чем русскоговорящие. Кто-нибудь пробовал, например, немецкую версию? Действительно она лучше, чем русская? (в немецком хотя бы с ударениями не так геморно, так шо разработчика живется луше) )

Автор: LKa48 8.08.2008 - 23:38:19
LonliLokli
я пробовал достаточно много аглицких.. Более того, имел возможность пообщаться с разработчиками некоторых из них (АТ&Т и ИБМ). Да, они действительно намного лучше! Лучше, хотябы потому, что гиганты (компании) заинтересованы в их постоянном развитии. Автоответчики, GPS и т.д. требуют своего! Немецкий - не знаю...

Автор: Sylvia 9.08.2008 - 07:11:23
LonliLokli
Знакомый очень хвалит немецкий движок Дагмар, женский голос. Говорит, намного лучше русскоязычных, очень натуральный голос. Я, кроме русских, других не слушала dunno

Автор: SMY 12.08.2008 - 10:17:11
Спасибо большое, Sirr. По вашим ответам - так вроде бы и всё понятно стало. Составила себе шпаргалку из сообщений Sirr & Slag и сегодня вечером (когда появятся свободные минуты) буду разбираться. Потом напишу что получилось. Еще раз спасибо.

Может быть я ещё не правильно Elan ставлю - имя пускового файла у меня отличается от того что пишете вы в своём сообщении от 12.08.2008 - 01:06. И файл readme.txt какой-то странный для меня по содержанию. Да и ещё при установки Elan мне предлагается установить его как сервер или индивидуально (извините, может быть я неправильно формулирую - делаю сейчас это по памяти). Вот в каком-то из этих вариантов - то звука у меня нет, то по-английскии Коля говорит.

Можно мне вам написать об этом подробнее в ПМ (только я сначала во всём разберусь), а то если здесь, то строгий админ или модератор - "заругаются" D

Автор: ededed 12.08.2008 - 10:26:44
SMY
Пить не будете? Голые танцевать не будете при луне? (с)
остальное-пожалуйста )

Автор: Sirr 12.08.2008 - 10:49:16
Цитата (SMY @ 12.08.2008 - 11:58)
Elan ставлю - имя пускового файла у меня отличается от того что пишете вы в своём сообщении от 12.08.2008 - 01:06. И файл readme.txt какой-то странный для меня по содержанию.

Дело в том, что файл Elan\exc_rus.txt не является пусковым.
Это вспомогательный файл собственного словаря ударений Николая. Его -то мы тут и пополняем общими силами.
Если у вас не идет программа Elan, то полезно ее стереть.
Потом метлой типа
Код
http://www.filehippo.com/download_ccleaner/
почистить комп и повторить операцию установки Elan снова.
У меня не было затруднений, может потому что ставил этот дистрибутив Николая : Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_MmE255_.msi

Автор: SMY 12.08.2008 - 10:59:59
Я имела в виду не словарь, а файл - Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai - после его запуска начинается установка программы - у меня расширение этого файла - EXE. А у вас другое - это разные вещи, да?

Автор: Sirr 12.08.2008 - 11:14:23
Цитата (SMY @ 12.08.2008 - 12:40)
- Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai - после его запуска начинается установка программы - у меня расширение этого файла - EXE.

Поищите этот дистрибутив Николая : Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_MmE255_.msi
Есть мнение, что он получше будет.
Тут есть пара полезных ссылок на Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_MmE255_.msi:
Код
http://www.websound.ru/mirrors_ext.php?file=speech/acapela-elan.zip

Автор: LonliLokli 12.08.2008 - 19:08:09
Не знаю, я опять "вернулся" к Алене. Я ее могу слушать и не теряю нить повествования через 2 минут, как это у меня было с Николаем.

Я, к сожелению, не разбираюсь в словарях, но: реально ли какое-то алгоритмическое решение ковертирования словаря от николая к алёне? можно было бы побаловаться с реализацией...

Автор: andrejbis 12.08.2008 - 19:36:59
SMY
Ссылки на голосовой движок есть также на сайте mp3book2005.narod.ru
Там же найдете последнюю версию "народного" словаря (раздел так и называется) exc_rus.txt, с которым Николай говорит реально гораздо грамотнее. Что касается речи на английском, то помимо выбора речевого движка в программе, с помощью которой вы будете слушать тексты, выставьте в системе по умолчанию Николая (Программы-Панель управления-Речь-Выбор голоса).

Автор: korvinio 13.08.2008 - 00:21:32
На счет Алены - троху разобрался с добавлении слова в словарь - над словом "америка" сидел 10 минут где-то. И читал к тому-же их корявую фонетическую таблицу - после неё и некоторых нормальных примеров - понял как ставить слоги и ударения. Слово конечно тяжело добавить - но результат куда лучше чем просто поставить ударения по аналогии с Николаем.
Вот как выглядит Америка ) :
#A1 m' e1 r' $ k A

Автор: gilbert 18.08.2008 - 11:16:23
Меня сразу озадачил ваш скриншот,поэтому я попросил вас дать мне эту версию.
Во-первых это триальная версия(Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_AbE-1.04.exe),устанавливающаяся по умолчанию в папку Acapela Telecom TTS,лимитированная 30-днями с ограниченной канальность.И не работает она со словарями .dic в KooBAudio.Определяется в читалках как Speech Cube Russian(Nicolai 16Khz)
А разлоченная версия этого же движка(со снятыми ограничениями) называется Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_MmE255_.msi,устанавливается по умолчанию в папку Elan-это то о чем я говорил(MmE255).Определяется в читалках как ELAN TTS Russian (Nicolai 16Khz).
А вот именно перед этой версией была версия от Telecom 5.0,которая возможно(честно говоря не помню,работала или нет) работала со словарями .dic,но даже разлоченная не позволяла ускоренно(>4x) писать в mp3.Однозначно можно сказать,что только версия Digalo Nikolay 4.2 работает со словарями .dic в KooBAudio,но тоже ограничение по скорости записи очень существенно.
Вот,что было в описании новой 5.1 версии:
Acapela Telecom HQ/HD V5.100
© Acapela Group 2004
1. Overview
Welcome to Acapela Telecom HQ/HD V5.100. formerly known as ELAN Sayso/Tempo Telecom
Along with this name change we introduce the first integrated version of BrightSpeech and Sayso technologies.
This edition replaces the previous edition : ELAN Sayso/Tempo Telecom V5.000. It also replaces Babel Technologies BabTTS SDK in telecom application context.
WARNING : Uninstalling all previous versions of ELAN Sayso/Tempo Telecom and BabTTS SDK is highly recommended before
installing this version (don't use this setup to remove previous version (this can lead to an error on Install
Shield script engine)).
All files will now be installed by default under the “c:\program file\Acapela Group\Acapela Telecom TTS” directory.

Я знаю пока только одну программу,которая работает со словарями .dic( только под SAPI 4)и с движком MmE255 и без ограничей по скорости записи в звукой файл,это Балаболка и работает это как в Win XP так и и Win Vista.

Автор: bobo4ka 18.08.2008 - 12:08:46
gilbert
Это не 30-дневная траальная версия..
Вернее она была триальной в самом начале, до того как её крякнули, убрав "триальность", и внесли изменения отключающие ограничения триальной версиии. Раньше это всё делалось отдельными файликами, потом всё необходимое включили в один инсталяционный файл, который я вам и предоставил.
По тому же принципу собиралась и 255-канальная мультимедия.. Тоже была взяла триальная версия над которой были проделаны выше приведенные операции. Сейчас доступны все 255 каналов. Об этом можно судить даже по скриншоту - функциональность не ограничена.. Книжки записываются за 15-20 минут максимум..Только что создал аудиокнигу за 6 минут (создание аудио+конвертация в мп3). Книга создавалась из файла "stepnoi_arkadii_put_beznadezhnogo.fb2" размером 1.144 мб.

С KoobAudio словарями *.dic работает прекрасно - уже больше года работаю с этим голосом и пользуюсь для записи только КубАудио.
Где-то в чём-то вы не разобрались, либо разобрались, но не до конца.. )

Автор: king 18.08.2008 - 14:00:01
В общем, были уже споры насчёт разницы звучания версий телеком и мультимедия. На ру боарде. В мультимедии диапазона воспроизводимых частот побольше. Но мне это наоборот мешало.

Автор: gilbert 18.08.2008 - 15:43:00
В споре рождается истина.
Поэтому с удовольствием хочу констатировать факт(относительно KooBAudio),что версия MmE255,не работает со словарями .dic(по крайней мере мне никак не удалось это),а вот версия предложенная bobo4ka действительно без проблем работает с этими словарями,без всяких ограничей по записи в звукой файл,поэтому конечно для поклонников KooBAudio-это то,что надо.
Да и exc_rus.txt также используется,если путь к нему указан в настройках программы,поэтому вполне можно разгрузить словари .dic,например перенести все слова в которых не используется *,&,$,а где только < в формат этого словаря.Я подключил словарь exc_rus.txt выложенный недавно slag,и KooBAudio его потянул.
Вот только не смог найти и понять под каким SAPI всё это работает,по-моему KooBAudio заточен под SAPI 5.
И еще один нюанс,MmE255 работает в Балаболке со словарями .dic под SAPI 4.Может автор этой проги,появляющийся здесь,объяснит,это он подогнал свою прогу под работу с этим движком,или нет,по крайней мере версия от bobo4ka тоже работает в Балаболке с .dic под Sapi4 и если в KooBAudio она работает с .dic под SAPI 5,то это наверное самое лучшее,что есть "от Николая".
Поэтому пока MmE255 под кровать,остановимся на версии предложенной bobo4ka.

P.S.Вот не написал бы по поводу поста alexv07 и вероятно не узнал бы о существовании еще одного вида голосового движка.

Автор: Вик111 27.08.2008 - 12:26:28
Полистал ветку и... !!! Нашел документальное подтверждение ранее обсуждаемого здесь. И Вызвавшего при этом бурю эмоций.

Вика2
Цитата
И тем не менее он будет, и будет именно к лету, как и указал в своем посте korvinio, потому что товарищу, о котором я Вам писала, в LOQUENDO ответили точно также.

Цитата
Multilingual & Multivoice American English, Canadian French, Brazilian Portuguese, American Spanish, Argentinian Spanish, Chilean Spanish, Mexican Spanish, British English, Castilian Spanish, Catalan, Valencian, Galician, Dutch, French, German, Greek, Italian, Polish, Portuguese, Swedish,Turkish, Russian*, Finnish*, Danish*, Mandarin Chinese (*available during 2008)

Language
American English 2 2
British English 2 1
Castilian Spanish 2 2
Catalan 1 1
Valencian 1
Galician 1
French 3 1
German 2 1
Italian 4 6
Greek 2
Portuguese 1 1
Swedish 1
Dutch 1 1
Polish 1 1
Brazilian Portuguese 2
Mandarin Chinese 2
Mexican Spanish 1
Chilean 1
Argentinean 1
American Spanish 1 1
Canadian French 1 1
Turkish 1 1
Danish (2008)
Finnish (2008)
Russian (2008)

Возможно сыроватость Алены вызвана попыткой опередить в битве гигантов на русском поле.
Код
http://www.loquendo.com/en/technology/TTS.htm

Ждем с нетерпением!!! clap

Автор: Sylvia 27.08.2008 - 14:53:30
Цитата (Р’РёРє111 @ 27.08.2008 - 14:07)
Возможно сыроватость Алены вызвана попыткой опередить в битве гигантов русском поле.

и чего ж мы с Аленой мучаемся? D

Автор: Вик111 27.08.2008 - 15:58:50
Цитата (Sylvia @ 27.08.2008 - 16:34)

и чего ж мы с Аленой мучаемся?

Да я больше с Катей. Там возможностей для умелого мазохиста побольше будет rolleyes

Автор: abdumanon 29.08.2008 - 21:39:37
Цитата (slag @ 25.08.2008 - 10:53)
Графическая оболочка для работы с консольными программами Ajaja и движком Acapela Infovox Alyona 22k.
Реализована через batники,протестированна на Win XP Pro.
По умолчанию всё прописано исходя из D:\ATTS\

user posted image

Скачать http://rapidshare.com/files/139916719/ATTS.zip.html или http://www.mediafire.com/?vj902uugqyy

Здравствуйте, друзья!

Всю жизнь завидовал людям умным! Тем, что умеют что-то вот эдакое сварганить! Раз, один утилиту написал! Два, другой оболочку для облегчения!
Это для таких дремучих, как я!!!!!!! blink

Но блин, я и так и так вертел...........
Вроде и папки обозвал как надо. Вроде и переменную среду прописал.....

Короче у меня толко функция переноса текстового файла в папку проги и его переименование сработала.


А дальше - ну не в зуб ногой!!!!

Ребя, умные и учёные! Помогите нам, сирым и неграмотным!

Напишите инструкцию лёгкую и доходчивую, что нуна зделать, чтобы чудо сие заработало!

От себя и от многих страждущих - благодарю Вас заранее!

Спасибо за помощь!

Автор: abdumanon 30.08.2008 - 00:33:08
Короче, мучался. мучался - не выходит.
Всё работает кроме записи в ВАВ из ТХТ с помощью Алёны.
Функция из ВАВ в МР3 работает. Методом эксперимента, разместил посторонний ВАВ файл в положенной папке и приказал проге переделать в МР3.
Послушалась!

Подскажите, что делать?

такое впечатление. что оно Алёну просто не видит. ( confused excl blink

Автор: slag 30.08.2008 - 04:15:22
abdumanon
Читайте внимательно,что пишется в нижнем окошке при наведении курсора мышки на кнопку Book to WAV.
Даже на скриншоте(см.выше) решение вашей проблемы указано.

p.s. а скоро появится немного получше версия,с более бОльшими возможностями...

Автор: Sylvia 30.08.2008 - 08:50:58
Цитата (abdumanon @ 30.08.2008 - 02:14)

Короче, мучался. мучался - не выходит.
Всё работает кроме записи в ВАВ из ТХТ с помощью Алёны.

А вы пробовали не менять пути, а распаковать утилитку прямо на диск D?
У меня тоже сначала не работало, когда я стала переименовывать диски, а потом решила попробовать с диска D - и все получилось. Потом и на диск F перенесла, все работает. Правда, переменную я прописывала раньше, еще когда не было графической оболочки.
Только вот почему-то некоторые слова по несколько раз норовят в словарь занестись. Т.е. в файле DIC оказываются слова, которые уже есть в словаре. Послушаю DIC, исправляю, импортирую в словарь - а уже есть такое) И еще неплохо было бы, чтобы старые файлы book, dic затирались. А то, если забудешь их удалить - никаких действий... А вообще утилитка классная дл яредактирования словаря!!! Спасибо большое! (Записываю в мр3 по-прежнему Кубаудио, привычнее)

Автор: Ajaja 30.08.2008 - 11:02:37
abdumanon
Цитата
Всё работает кроме записи в ВАВ из ТХТ с помощью Алёны.

Похоже на проблему с лицензией. Надо удалить все файлы с С:\Infovox2.lic , скачать с рубоарда последнюю версию генератора, перегенерировать лицензию, и втянуть ее.

Sylvia
Цитата
Только вот почему-то некоторые слова по несколько раз норовят в словарь занестись. Т.е. в файле DIC оказываются слова, которые уже есть в словаре.

Такое может быть, если основной словарь привязан не к тому голову, который исполюзуется при проверки ударений. Оболочка, если не ошибаюсь, настроена на дефолтного диктора Alyona22k, вот его словарь и используется.

Автор: Sylvia 30.08.2008 - 12:34:02
Цитата (Ajaja @ 30.08.2008 - 12:43)

Такое может быть, если основной словарь привязан не к тому голову, который исполюзуется при проверки ударений. Оболочка, если не ошибаюсь, настроена на дефолтного диктора Alyona22k, вот его словарь и используется.

Да нет, новый голос не создавала, только Alyona22k с соответствующим словарем. Всех слов не припомню, но, например, йогурт, достигать, граждан, граждане, сограждане упорно каждый раз заносятся в dic.

Автор: abdumanon 30.08.2008 - 14:26:53
Цитата (Ajaja @ 30.08.2008 - 12:43)
abdumanon
Цитата
Всё работает кроме записи в ВАВ из ТХТ с помощью Алёны.

Похоже на проблему с лицензией. Надо удалить все файлы с С:\Infovox2.lic , скачать с рубоарда последнюю версию генератора, перегенерировать лицензию, и втянуть ее.

Боюсь показаться полным.......... Но у меня такого файла на диска С: просто нет.

Прогу я пропатчил ключиком из Вашей програмульки, у меня показывает, что версия АНЛИМИТ.

Но файлика такого нет dunno

Тот файл, что образовался у меня после патчения Infovox.lic (т.е. без 2, не знаю, важно это или нет)

Ну потёр я его, но всё равно лицензия не убралась. dunno

user posted image


Автор: abdumanon 30.08.2008 - 14:36:11
Цитата (slag @ 30.08.2008 - 05:56)
abdumanon
Читайте внимательно,что пишется в нижнем окошке при наведении курсора мышки на кнопку Book to WAV.
Даже на скриншоте(см.выше) решение вашей проблемы указано.

p.s. а скоро появится немного получше версия,с более бОльшими возможностями...

В ожидании томном трепетная душа прибывает! lol clap

Буду следить за форумом.

ТОЛЬКО ПОЖАЛУЙСТА, ДРУЗЬЯ, НАПИШИТЕ ХОТЬ НЕБОЛЬШУЮ ИНСТРУКЦИЮ, КАК С ЭТИМ ВСЕМ ВЗЛЕТЕТЬ?!!!!!!!!! handup

Автор: Ajaja 30.08.2008 - 18:24:49
abdumanon
Цитата
Но у меня такого файла на диска С: просто нет.

С:\Infovox2.lic - это скрытый каталог. Надо, действительно, смотреть, что програма пишет. Если "Error: BabTTS_Write()" тогда это может быть как раз из-за лицензии. Сам каталог надо оставить, а все файлы из него удалить. Если этого не сделать, то движок может подтягивать старую лицензию из этого каталога. Потом втянуть новую лицензию (файл Infovox.lic) в License Manager.

Sylvia
Цитата
Всех слов не припомню, но, например, йогурт, достигать, граждан, граждане, сограждане упорно каждый раз заносятся в dic.

Это слова, в которых в словаре AOT неправильно занесено ударение. Я их уже несколько десятков отловил. Большую часть отправил на www.aot.ru для исправления, но пока ни ответа ни привета ( Пока что их надо просто удалять - Алена и так их нормально произносит.



Автор: Sylvia 30.08.2008 - 21:20:53
Цитата (Ajaja @ 30.08.2008 - 20:05)

Это слова, в которых в словаре AOT неправильно занесено ударение. Я их уже несколько десятков отловил. Большую часть отправил на www.aot.ru для исправления, но пока ни ответа ни привета  Пока что их надо просто удалять - Алена и так их нормально произносит.

Тогда все понятно, спасибо!

Автор: abdumanon 31.08.2008 - 00:39:57
Цитата (Ajaja @ 30.08.2008 - 20:05)
С:\Infovox2.lic  - это скрытый каталог. Надо, действительно, смотреть, что програма пишет. Если "Error: BabTTS_Write()" тогда это может быть как раз из-за лицензии.  Сам каталог надо оставить, а все файлы из него удалить. Если этого не сделать, то движок может подтягивать старую лицензию из этого каталога.  Потом втянуть новую лицензию (файл Infovox.lic) в License Manager.

Как у кота Матроскина: УРААААААААА!!!! Заработало!!!!!!!!!!!

вся бадяга была в лицензии!!

Теперь бы всё это присовокупить к какой-то готовой проге.
Ну, типа. чтоюы на главы делила, красную строку добавляла.....

Ну типа KooBAudiO....

Кстати поделюсь одним наблюдением, не знаю у вас так или нет?

Пользовал до этого МР3book2005. С николой и катей всё было вроде ничего.

Но вот с Алёной происходит такой казус: в режиме чтения - голос, просто обо...слушаешься!! clap

Но, после записи - такое впечатление, что девушке кто-то по губам надавал! lol

МР3 файл на выходе получается ШЕПЕЛЯВЫЙ какой-то.

Из - за этого и вернулся на KooBAudiO. После этой проги - всё в порядке!

Вот такая вот петрушка..... dunno
Добавлено: [mergetime]1220136565[/mergetime]
И такой вопрос: вот пробовал бороться - слово ДУША упорно не хочет читать с ударением на А.

Перестановка 1 цы ничего не даёт. Всё равно : дУша! confused dunno

Автор: king 31.08.2008 - 00:52:30
Цитата (abdumanon @ 31.08.2008 - 02:20)

Но, после записи - такое впечатление, что девушке кто-то по губам надавал! 

МР3 файл на выходе получается ШЕПЕЛЯВЫЙ какой-то.

Наверно старой версией mp3бука пользовался? Так как она конвертит Алену с на 16 кГц mp3, то ухудшение будет. Кубаудио делает на 22 кГц.

Цитата (abdumanon @ 31.08.2008 - 02:20)

И такой вопрос: вот пробовал бороться - слово ДУША упорно не хочет читать с ударением на А.

Значит , Алёне приятней мыться под дУшем. чем думать о душЕ.


Автор: trubodur 1.09.2008 - 14:42:40
можно ли алену научить правильно говорить фразы "приятнее или" "стены обыденной жизни" "что это наяву и он заброшен" полно таких фраз. Она почемуто не делает пробелов, сливаются слова.Порой хрен поймеш че она хрюкнула ) Ето вообще лечится?

Автор: abdumanon 1.09.2008 - 17:15:05
Цитата (Sylvia @ 1.09.2008 - 15:29)
Цитата (trubodur @ 1.09.2008 - 13:58)

народ а где создать и как этот новый голос допереть немогу подскажите пжалста

C:\Program Files\Acapela Group\Infovox Desktop 2.2\VMan.exe
Поставить курсор на Alyona22k, нажать ctrl+N, в открывшемся окошке написать название, нажать create и редактировать по своему вкусу rolleyes
Кнопка с дискеткой будет активная в этом новом голосе.

Блин, я только после этого поста допёр, что Вы имели ввиду, говоря о создании нового голоса!

Попробоавл, получилось!
--------------

Ну, по видимому так же не подлежат решению такие задачи: добиться правильного ударения в таких случаях, например, как "они мне дОроги"
и пролегди две дорОги".

Интересно, а понимает Алёна словосочетания? Вводить не словами, а словосочетаниями такие казусы? А?

Автор: Sylvia 1.09.2008 - 17:37:32
Цитата (abdumanon @ 1.09.2008 - 18:56)

Блин, я только после этого поста допёр, что Вы имели ввиду, говоря о создании нового голоса!

Прошу прощения, что непонятно выражалась(
Цитата (abdumanon @ 1.09.2008 - 18:56)

Ну, по видимому так же не подлежат решению такие задачи: добиться правильного ударения в таких случаях, например, как "они мне дОроги"
и пролегди две дорОги".
Интересно, а понимает Алёна словосочетания? Вводить не словами, а словосочетаниями такие казусы? А?

Понимает, если заставить ее говорить без SAPI (т.е. записывать мр3 утилиткой Ajaja-slag), или с SAPI4 (слушать встроенным SpeechPad-ом или AudioBook). Если кто-то знает другой способ - поделитесь, сама мучаюсь с этой проблемой омографов...

Автор: trubodur 4.09.2008 - 13:07:31
Цитата (trubodur @ 1.09.2008 - 16:23)
можно ли алену научить правильно говорить фразы "приятнее или" "стены обыденной жизни" "что это  наяву  и  он  заброшен" полно таких фраз. Она почемуто не делает пробелов, сливаются слова.Порой хрен поймеш че она хрюкнула ) Ето вообще лечится?

народ у когонить есть такая проблема мож там какие настройки изменить а я незнаю ктонить подскажите

Автор: szasz 4.09.2008 - 14:14:18
Цитата (trubodur @ 4.09.2008 - 14:48)
Цитата (trubodur @ 1.09.2008 - 16:23)
можно ли алену научить правильно говорить фразы "приятнее или" "стены обыденной жизни" "что это  наяву  и  он  заброшен" полно таких фраз. Она почемуто не делает пробелов, сливаются слова.Порой хрен поймеш че она хрюкнула ) Ето вообще лечится?

народ у когонить есть такая проблема мож там какие настройки изменить а я незнаю ктонить подскажите

и = , и
или = , или

Автор: slag 5.09.2008 - 19:59:22
ATTS - Alyona Text To Speech
(такой своеобразный "комбайнчик")

Протестировано на Win XP SP2 Rus и Win Vista SP1 Rus
Перед началом работы необходимо создать новый голос и назвать его AlyonaTTS,
ну и соответственно привязать к нему имеющиеся словари.

user posted image

Скачать http://www.mediafire.com/?xidsxznmtlb или http://rapidshare.com/files/142880588/ATTS.zip

P.S. Делал для своих личных целей (я не программист и даже не любитель, просто
возникла задумка ,и решил реализовать доступными мне методами)
P.P.S. Если кто-то знает или напишет хороший батничек по разрезанию текста по
контрольному слову,поделитесь(можно с использованием сторонней консольной утилиты).

Автор: slag 8.09.2008 - 02:50:26
Небольшой upgrade - ATTS
Исправил кое-какие небольшие ошибки и неточности в описании.
Добавил разрезание по главам (Глава или ГЛАВА)

http://rapidshare.com/files/143490613/upgrade.zip или http://www.mediafire.com/?xyzmzwtnflg `500 кб

Для очень подозрительных ниже.

http://keep4u.ru/full/080908/ba97ca836c7ca9c248/jpg

Автор: Lexus2008 8.09.2008 - 11:49:06
2slag
Ваша программа настроена на диск D: . У меня не получается заставить ее работать на E: со сменой каталогов. Правил xml, к bat из программы не пускает. Может можно сделать настройку на каталог автоматической? Что порекомедуете.

Автор: slag 8.09.2008 - 14:54:20
Lexus2008
Цитата
Ваша программа настроена на диск D: . У меня не получается заставить ее работать на E: со сменой каталогов. Правил xml, к bat из программы не пускает. Может можно сделать настройку на каталог автоматической? Что порекомедуете.


Только вот это.
Для работы с диска E.
http://www.mediafire.com/?yvzqdomimth или http://rapidshare.com/files/143597866/ATTS-E.zip

Правда под Win2000 я не тестировал,и не могу сказать будет ли это гарантированно работать под этой системой.

Автор: szasz 14.09.2008 - 12:57:29
Цитата (Sylvia @ 14.09.2008 - 11:35)
Цитата (balabolka @  14.09.2008 - 01:26)

В следующей версии "Балаболки" будет реализована возможность работы с несколькими словарями омографов (файлов с расширением *.hmg). Спасибо за идею!

это будет здорово! Спасибо Вам за программу! А нельзя заодно сделать, чтоб все файлы словарей хранились в папке программы, а не в папке "мои документы"?
Может, я слишком много хочу, но было бы, мне кажется, удобно, если бы вручную искались омографы, написанные только строчными буквами. Я автоматически заменяю все омографы в тексте с помощью словаря szasz slsoch.dic, но если нужно после этого еще провести поиск вручную (ctrl+M), то находятся и исправленные слова, например рУки, гОры и т.п. Я далека от программирования, так что извините, если прошу невозможного.

Цитата
DIC-файлы со списками замен
Каждая строка такого файла содержит шаблон и текст, которым будет заменен данный шаблон в тексте; между ними стоит знак равенства (=). В первую очередь рассматриваются шаблоны с максимальным количеством букв.

Строки комментариев начинаются со знака "решетка" (#).

По умолчанию программа не учитывает различий между прописными и строчными буквами при рассмотрении шаблонов. Если регистр букв имеет значение, необходимо добавить символ "$" в начало строки. Например:

$МАГ=Международная ассоциация геодезии


По умолчанию шаблон представляет из себя отдельное слово (или несколько слов), ограниченное пробелами или знаками препинания. Если шаблон является частью слова, то для обозначения того, что перед текстом или после него могут быть любые символы, используется символ "*" (звездочка). Например:

авто*=авта

Данное правило будет применено к словам "автомобиль", "автокатастрофа" и т. д. Чтобы использовать в тексте специальные символы ("#", "*", "$", "="), необходимо записать их дважды в соответствующем месте, например:

**=звёздочка

В этом случае отдельный символ "*" в тексте будет читаться как "звёздочка".

Чтобы поменять ударение, в текст можно вставлять пробелы или двойные гласные буквы, например: "бигудии", "про скакать". Приёмы изменения ударений могут быть различны и зависят от особенностей голосового движка. Иногда приходится поэкспериментировать, чтобы добиться нужного результата.

Необходимо заметить, что словари для Digalo Russian Nicolai не всегда удастся использовать для голосов SAPI 5, так как угловые скобки, обозначающие ударение в словарях для голосов Digalo, используются для обозначения служебных тэгов в SAPI 5.



Автор: Lexus2008 14.09.2008 - 13:57:00
Цитата (rquester @ 14.09.2008 - 12:56)

А Loquendo вроде же только английский?

На сайте Loquendo выпуск русского движка назначен на 2008.Ссылка на этой ветке.
Цитата (rquester @ 14.09.2008 - 12:56)

Поскольку мне на данный момент больше нравится Катерина буду признателен за ее аналог да этой дамы
В смысле?

Это я по поводу утилиты которую разработал Ajaja для поиска проблемных слов в тексте для Алены.Очень интересная утилита.Сам я на С не программирую и на вряд ли справлюсь с данной задачей.
Если Вам позволяет время полистайте ветку примерно с момента появления на ней сведений об Алене.

Автор: rquester 14.09.2008 - 15:19:30
Lexus2008
Очень интересная утилита.Сам я на С не программирую и на вряд ли справлюсь с данной задачей.
Главная проблема всех подобных утилит - ориентированность на конкретные движки. Так как в SAPI4/SAPI5 нет соответствующих функций, то все движки их реализуют по своему. И проблема как раз в том, что нужно разбираться с неописанными нигде (или плохо описанными) внутренними функциями, внутренними форматами словарей... А вышел новый движок (а в некоторых случаях и просто новая версия движка) - и все проблемы по новой...
Моя программа пытается унифицировать общение с движками. Все что нужно от движков (первоочередное) - какой-нибудь способ расстановки ударения в тексте... К сожалению, пока этот способ найден только для Катерины и Николая. Если будет для других (того же Loquendo) - в программу несложно добавить. Но добавлять всяки "хаки", использование внутренних функций движка, я в программу не планирую...
Если создатели движка не удосужились придумать хоть какой-то способ расстановки ударений в тексте (или хотя бы задание произношения) - движок "фтопку"...

Автор: king 29.09.2008 - 13:10:40
Кто ставил Алёну на XP HOME, будет работать с говорилками? Хочу прикупить субноут ACER EEE 700, так как надоело сначала записывать, хочу свободно слушать. Вопрос к специалистам, будет ли на нём работать, XP HOME, 4GB жёсткий диск флешка наверно, 512 DDR. Не записывать в MP3, а просто говорить.

Автор: Kamerer 29.09.2008 - 18:30:15
Цитата
Кто ставил Алёну на XP HOME, будет работать с говорилками


А почему нет ?.. Естественно будет )

Цитата
ACER EEE 700


Может ASUS EEE 700 ?

Автор: king 29.09.2008 - 18:53:41


Цитата (Kamerer @ 29.09.2008 - 20:11)

Может ASUS EEE 700 ?

Правильно, ASUS EEE 701.

Цитата (Kamerer @ 29.09.2008 - 20:11)

А почему нет ?.. Естественно будет 

Купил, всё работает. )

Автор: korvinio 3.10.2008 - 01:09:37
Цитата
Привет и найлучшие пожелания всем. Набрел тут на доселе мне неизвестный русский женский голос. Звучит вполне на уровне Алены, если не лучше. Примеры звучания тут:
Код
http://www.svox.com/TTS-Demos.aspx
Но выяснить поподробнее что это за движок, и как его скачать мне сходу не удалось.Я работаю под Джозом, и с аглицким не очень. Может кто возьмется разобраться со всем этим и выложить сие чудо на какой-либо удобный русский сайт, если это вобще возможно?  Я думаю все участники темы будут за это благодарны. Кстати, забыл упомянуть, там не только русский, там полно разных языков.

По примеру - очень хороший синтез.

Автор: slag 3.10.2008 - 02:35:32
korvinio

Это не для нас ,это вот для кого:
Цитата

Our partners.
Our partners in the automotive industry include German, Japanese and U.S. Tier-1 suppliers. They provide their navigation systems featuring our solutions to OEMs such as BMW, Audi, Daimler, Nissan, PSA, and Volkswagen.
Our partners in the mobile devices industry include mobile devices manufacturers and mobile navigation software providers.


Автор: smash94 4.10.2008 - 01:12:54
Задавал этот вопрос на другом форуме, но ответа не получил. Попробую здесь:

По поводу нового голосового движка Alyona22k вопрос возник: А как быть со встроеной автозаменой?

Ну например:

"13:25" произносится как: "тринадцать часов двадцать пять минут"

а если я хочу чтобы оно произносило просто "тринадцать двадцать пять" безо всяких часов и минут, т.к. в тексте не всегда поставленные через двоеточие двузначные числа - это время. Это запросто могут быть какие-то координаты или типа того.

Как подобные нюансы произношения настроить под себя?

Заранее спасибо за разъяснения. shuffle

Автор: slag 4.10.2008 - 23:56:52
LeoPreacher
Ваш пост можно расценить как призыв к очередному холивару.
Если вы смогли осилить всю эту ветку,то зачем вам еще,что-то.
Все разжевано и так до "жидкого пюре",осталось только проглотить.

smash94
Ну а просто пробел перед двоеточием поставить...

Автор: Kamerer 10.10.2008 - 19:19:01
Образцы нового голоса - Ольга (Loquendo):

Код
- с эмоциями http://www.loquendo.com/en/audio/Olga.mp3
- текст http://www.loquendo.com/en/audio/Olga-v2.mp3

Автор: Lexus2008 10.10.2008 - 20:55:47
Образцы нового голоса - Ольга (Loquendo)

Да,впечатляет и даже восхищает.

Интересно а как в "полевых условиях" слушется конвертированная книга.
Или опять старая песня "Нету никого лучше Николая"

Автор: balabolka 10.10.2008 - 21:12:46
Да, это хорошая новость! Мужской голос от Loquendo появится в первой половине 2009 года.
Код
http://www.loquendo.com/en/news/news-loquendo-russian-olga.htm

Автор: Kamerer 13.10.2008 - 14:01:03
Установил и опробовал Ольга (Loquendo) - получше Алены (по первым впечатлениям)...

Автор: Ajaja 13.10.2008 - 18:11:57
Цитата (trubodur @ 13.10.2008 - 16:14)

ajaja жду твоих коментариев как специалиста

Спасибо, за наводку. Я эту тему на рубоарде прозевал.
Только что выкачал. Раньше голоса Loquendo ни разу не использовал, так что тут "специалистом" меня трудно назвать ;) Первое впечатление неплохие. Очень навороченый движок, есть родной SDK. Но к акценту Ольги придется привыкать. ;)


Добавленно
Есть еще один недостаток Ольги - это невысокая скорость речи. А это для меня главное. Так что, думаю, останусь с Аленкой, так как не люблю я медленное чтение, и предпочитаю "проглатывать" книги на максимально скорости ;)

Автор: trubodur 14.10.2008 - 13:56:18
Цитата (Ajaja @ 13.10.2008 - 19:52)
Цитата (trubodur @ 13.10.2008 - 16:14)

ajaja жду твоих коментариев как специалиста

Спасибо, за наводку. Я эту тему на рубоарде прозевал.
Только что выкачал. Раньше голоса Loquendo ни разу не использовал, так что тут "специалистом" меня трудно назвать ;) Первое впечатление неплохие. Очень навороченый движок, есть родной SDK. Но к акценту Ольги придется привыкать. ;)


Добавленно
Есть еще один недостаток Ольги - это невысокая скорость речи. А это для меня главное. Так что, думаю, останусь с Аленкой, так как не люблю я медленное чтение, и предпочитаю "проглатывать" книги на максимально скорости ;)

а что такое SDK

Автор: Kamerer 14.10.2008 - 14:32:56
среда разработки приложений

Автор: Lexus2008 14.10.2008 - 17:43:43
У Ольги голос можно изменить до мужского, присутствует и регулировка тембра(большая редкость). Интонациями напоминает Николая.
Ошибок в ударениях практически незаметно, если не считать отсутствие Ёфикации.
Скорость чтения регулируется и на max сопоставима с 7 SAPI5 Катерины. Лично для меня даже многовато. Привыкание быстрое. Не раздражает. Чувствуется серьезная работа создателей.
Конечно разработчики немного спиарили назвав ее Ольгой. На мой взгляд к ее акценту курлянских немцев (или земляков Раймонда Паулса, этоуж как кому больше нравится) более подошло бы имя Инга,Эльза или что-то в этом духе.
Вот такие впечатления)

Автор: evilone 15.10.2008 - 02:57:16
это все предубеждения )
Олька это не Аленка
стало намного лучше Кольки но все равно чувствуется что компьютер читает
Аленка более красивее произносит фразы и в целом звучит "человечнее" Ольки

Автор: Sylvia 15.10.2008 - 10:45:13
Цитата (evilone @ 15.10.2008 - 03:38)

Олька это не Аленка
стало намного лучше Кольки но все равно чувствуется что компьютер читает
Аленка более красивее произносит фразы и в целом звучит "человечнее" Ольки

Согласна. У Ольги есть какой-то акцент, она более "механическая", Алену слушать приятнее, если не учитывать ошибки с ударениями. Но на вкус и цвет... wink Кому-то и Катерина нравится)
А кто-то пробовал создавать новый голос на основе Ольги и редактировать словарь в Lexicon-е? Новый голос у меня сохранился, но в программах-читалках в SAPI 5 его нет(

Автор: smash94 16.10.2008 - 16:18:54
И всё же ""Нету никого лучше Николая"©. )

Новая Ольга вообще не понравилась, не лучше Катерины.

По прежнему в качестве замены Николаю вижу только Алёну, и то... как только будут приличные словари.

Автор: balabolka 23.10.2008 - 11:44:13
Цитата (Stroodder @ 23.10.2008 - 04:47)

А использовать SAPI и TTS движка вместе невозможно?

Нет, невозможно. Loquendo должен было предусмотреть способ использования своих уникальных тегов через SAPI, но почему-то они этого не сделали (или, точнее, нам об этом пока ничего не известно).

Вообще, все эти разговоры о ttsSetParam(hReader,"TaggedText","true"); не имеют смысла, так как в текущей сессии параметр TaggedText и так всегда равен "TRUE". Можете сами поэкспериментировать - добавить ключ TaggedText в системный реестр:

[HKEY_LOCAL_MACHINE\\Software\\Loquendo\\LTTS7\\default.session]

Если TaggedText=TRUE, то программа "Loquendo TTS7 Voice Experience" в составе "Ольги" будет читать теги, если TaggedText=FALSE - не будет. Об этом написано в "Loquendo TTS 7 Programmer's Guide", раздел "Related Pages/Configuration Parameters".

Автор: trubodur 23.10.2008 - 12:38:17
мда и чво нельзя не че сделать? -(

Автор: aleks22 24.10.2008 - 13:33:25
Народ! А когда выпустят мужской голос от создателей Ольги(Loquendo)?
Вроде слышал что скоро...а когда?

Автор: balabolka 25.10.2008 - 17:59:23
Цитата (Stroodder @ 25.10.2008 - 12:43)
Татьяна с тэгами читает через SAPI, Ольга же не хочет. А почему обязательно заставлять движок работать только с SAPI?

Что за "Татьяна"? Мне такой голос неизвестен.

SAPI и был придуман именно для того, что программистам не надо было писать специальный программный код для поддержки голосов от различных фирм. Иначе можно было бы сойти с ума, ведь, например, тот же Loquendo при переходе от 6-ой версии движка к 7-ой версии внес изменения в свою объектную модель (об этом написано в том же файле справки, "Migrating from Loquendo TTS 6.x"). Замучиваешься разбираться с API каждого речевого движка, добавлять поддержку этого API в свой программный продукт. Такую программу еще никому не удалось создать.

Сейчас у меня на компьютере установлено голосов восемьдесят от 8-9 производителей. Благодаря SAPI можно нормально их использовать, ничего не "подкручивая" внутри компьютерной программы. А вот если надо что-то "подкручивать" (например, "Алена" не работает через SAPI 4), то вопросы следует адресовать разработчикам голоса, а не создателям TTS программ. Это относится и к тегам Loquendo - им надо было реализовать поддержку этих тегов при работе через SAPI.

Автор: cation 25.10.2008 - 20:19:43
Татьяна, как я понял - предтеча Катерины.

Автор: Stroodder 26.10.2008 - 04:35:23
balabolka
cation

))) Нет, конечно не Татьяна, ошибся, это про Аленку Infovox, у меня голос, созданный на ее основе так называется )

Добавлено
balabolka

О системе плагинов не было идей (непросто конечно это, но не обязательно COM)? Сторонние разработчики могли бы включать TTS для каждого движка.

Автор: Ajaja 27.10.2008 - 11:26:27
Цитата (Lexus2008 @ 27.10.2008 - 12:45)
Ajaja
Возможно ли появление в недалеком будущем AccentFixer.exe для Ольги? Движок очень уж хороший, особеннон на в верхнем диапазоне частот.

Движок, действительно, хорош. Но я совершенно не понимаю, зачем разработчикам, учитывая неплохие частотные характеристики голоса, надо было так сильно занижать максимальную скорость речи Ольги ( Повторюсь, для меня это критично. Я сейчас слушаю Алену на скорости 225 (75% от ее потенциала - даже есть еще куда повышать по мере привыкания), а Ольга на своем максимуме раза в полтора медленее говорит от этих 75% Алены. Повторяется история с тормознутой первой Катериной от Nextup-а, но тогда удалось найти ключик в реестре и ускорить ее. Пока не решится эта проблема с Ольгой, я вряд ли буду ее использовать.

Автор: Stroodder 27.10.2008 - 11:56:26
Ajaja
Скорость записи в wav Алены и Ольги не замеряли, как в сравнении с шустрым Elan?

Автор: evilone 27.10.2008 - 15:25:39
Stroodder специально не меряли но Аленка где-то 3-5Мб текст за 10-15 минут пишет (8-12 часов на нормальной скорости чтения)
хотя это наверно от "железа" во многом зависит.

Автор: sm151058 27.10.2008 - 15:33:10
Цитата (Ajaja @ 27.10.2008 - 14:19)
Цитата (Lexus2008 @ 27.10.2008 - 12:45)
Ajaja
Возможно ли появление в недалеком будущем AccentFixer.exe для Ольги? Движок очень уж хороший, особеннон на в верхнем диапазоне частот.

Движок, действительно, хорош. Но я совершенно не понимаю, зачем разработчикам, учитывая неплохие частотные характеристики голоса, надо было так сильно занижать максимальную скорость речи Ольги ( Повторюсь, для меня это критично. Я сейчас слушаю Алену на скорости 225 (75% от ее потенциала - даже есть еще куда повышать по мере привыкания), а Ольга на своем максимуме раза в полтора медленее говорит от этих 75% Алены. Повторяется история с тормознутой первой Катериной от Nextup-а, но тогда удалось найти ключик в реестре и ускорить ее. Пока не решится эта проблема с Ольгой, я вряд ли буду ее использовать.

А что, ускорить другими средствами нельзя? (если это главное препятствие к применению).
У меня, например, даже простенький МР3 плеер умеет ускорять воспроизведение

Автор: sm151058 27.10.2008 - 18:27:07
Лучше б один раз с возможной корректировкой. Вообще пора делать FAQ, а то прочтение 24-х страниц картину не проясняет. Нарпимер, обилик словарей пугает, надо бы сделать один более-менне универсальный к каждому из движков. И с программами что-то я не пойму, почему здесь пишут, что словарь для Балаболки. Что, для других программ другой?

Автор: Ajaja 27.10.2008 - 18:27:34
Цитата (Stroodder @ 27.10.2008 - 13:23)
Ajaja
Скорость записи в wav Алены и Ольги не замеряли, как в сравнении с шустрым Elan?

С Elan-ом не сравнивал. А так Ольга записывает намного быстрей, чем Алена (в разы). Что не удивительно - фонетическая база у Аленки в несколько раз больше.

Цитата (sm151058)
А что, ускорить другими средствами нельзя? (если это главное препятствие к применению).
У меня, например, даже простенький МР3 плеер умеет ускорять воспроизведение

На таких скоростях важна разборчивость речи. Тут постобработка wav-файла не лучший выход. Хотя, попробовать, конечно можно.

Автор: Sirr 27.10.2008 - 19:11:22
Цитата (Ajaja @ 27.10.2008 - 19:54)

На таких скоростях важна разборчивость речи.

Уважаемый!
О какой разборчивости речи у Алёны может идти речь?
Может на вашем компе она не булькает и не дёргает окончания слов внутри предложений?
Что касается моего компа.
GenuineIntel Intel® Core™2 Duo CPU E6850 @ 3.00GHz
Оперативки 3 гига.
ОС Microsoft Windows XP Professional x86 Editon, Service Pack 3.
Отдельные куски фраз Алёне удаются неплохо, но слитность произношения на пока твёрдую двойку.

Автор: sm151058 27.10.2008 - 20:14:41
Цитата (Sirr @ 27.10.2008 - 20:38)
Уважаемый!
О какой разборчивости речи у Алёны может идти речь?
Может на вашем компе  она не булькает и не  дёргает окончания слов внутри предложений?



Да уж. Шут с ними , с ударениями и акцентом. Но эти взвизгивания немного напрягают. Как бы их ликвидировать? А то все тексты будто Латынина читает.

Автор: Sirr 27.10.2008 - 20:17:53
Цитата (sm151058 @ 27.10.2008 - 21:41)

Как бы их ликвидировать?

Пока никак.
Ждем-с.
Похоже разработчикам нужно Николая поженить с Аленой handup
Появятся детки... clap

Автор: Ajaja 27.10.2008 - 21:42:42
Цитата (Sirr)
2. Можно ли заикания и булькания Алёны как то смягчить? Может у меня битая версия её движка?

Нужен пример фраз, где заикается и булькает.

Автор: Sirr 27.10.2008 - 21:43:40
Дамы и господа!
В чем главный недостаток Николая?
Слабый эмоциональный фон чтеца.
Может есть смысл поработать имено с коррекцией его тембров, темпа, тона?
Есть ведь программки у звуковых мастеров, которые умеют из плохого певца сделать супер звезду.
Берем Николая в формате вав , пропускаем через синтезатор и получаем нечто совершенно гармоничное и приятное слуху.
Меняя параметры, можно каждую новую книжку слушать новым голосом.
Для примера несколько доступных программ.
Код
http://cjcity.ru/soft/cat10.html

Автор: drYY 27.10.2008 - 21:44:33
подскажите пожалуйста какой движок наиболее РАЗБОРЧИВ для восприятия смысла, остальное мелочи - для меня, мучаюсь выбором dunno

Автор: cation 27.10.2008 - 22:33:24
drYY
На сегодня, ИМХО, Ольга. Ну, немного подстроить под себя тембр и скорость - и будет Вам счастье!

Автор: sm151058 28.10.2008 - 11:22:01
Цитата (drYY @ 27.10.2008 - 23:11)
подскажите пожалуйста какой движок наиболее РАЗБОРЧИВ для восприятия смысла, остальное мелочи - для меня, мучаюсь выбором  dunno

Судя по результатам опроса (на пред стр) Николай - вне конкуренции

Автор: sm151058 28.10.2008 - 11:29:14
Цитата (Sylvia @ 27.10.2008 - 23:10)
Насчет бульканья - не замечала dunno . Может, выложите маленький образец мр3 и исходный текстовый файл?


А не могли бы Вы описать Ваши настройки с указанием, какую программу используете (максимально подробно, и какие и куда Вы словари подкладываете). Ато , например, у меня, булькает и заикается достаточно регулярно, не заметить этого я не могу себя заставить (Балаболка, словарь простенький, текст без редактирования)

Автор: Lexus2008 28.10.2008 - 11:52:25
Цитата (sm151058 @ 28.10.2008 - 12:49)

Судя по результатам опроса (на пред стр) Николай - вне конкуренции


Наглядное свидетельство популярности средненьких книг, сериалов и движков. Когда пользователь выбирает не лучшее, а разжеванное.

Автор: Sirr 28.10.2008 - 12:04:22
Цитата (Lexus2008 @ 28.10.2008 - 13:19)

Когда пользователь выбирает не лучшее, а разжеванное.

Алену наверно можно было бы доработать , сгладив некие раздражающие выкрикивания отдельных слов в предложениях и странное её пробулькивание.
НО!
Сдаётся мне, что её движок не может быть изменён в этом аспекте.
Поэтому слушаю Николая. Его чтение хоть и несколько более монотонно, но предложения он строит более корректно, по крайней мере для русского уха )

Автор: ninibel 28.10.2008 - 12:11:43
Разжеванное экономит драгоценное время. Получить эстетическое наслаждение даже от лучшего компьютерного голоса пока не получается. Если кто-нибудь берется улучшать (есть время и желание) например словари - флаг ему в руки и глубочайшие респекты.

Автор: Lexus2008 28.10.2008 - 14:02:43
Цитата (ninibel @ 28.10.2008 - 12:58)

Разжеванное экономит драгоценное время



По опыту заметил, что на выбор движка оказывает влияния:
1. Уровень общей компьютерной грамотности
2. Трудолюбие пользователя

Автор: Sirr 28.10.2008 - 14:11:30
Цитата (Lexus2008 @ 28.10.2008 - 14:49)

2. Трудолюбие пользователя

Непонятно в чей огород камень, но качество движка Алены действительно слабее Николая, в смысле слитности и гладкости построения предложений.

Автор: trubodur 28.10.2008 - 14:41:17
Цитата (Lexus2008 @ 28.10.2008 - 14:49)
Цитата (ninibel @ 28.10.2008 - 12:58)

Разжеванное экономит драгоценное время



По опыту заметил, что на выбор движка оказывает влияния:
1. Уровень общей компьютерной грамотности
2. Трудолюбие пользователя

как минимум восприятие

Автор: Sylvia 28.10.2008 - 14:54:40
Цитата (trubodur @ 28.10.2008 - 14:28)

По опыту заметил, что на выбор движка оказывает влияния:
1. Уровень общей компьютерной грамотности
2. Трудолюбие пользователя
как минимум восприятие

Точно) Главное - восприятие. Ибо записываю не только для себя, а для других людей, которые понятия не имеют о тонкостях предварительной подготовки текста и об особенностях движка. Когда подготовка текста занимает больше времени, или примерно столько же, как звучит книга, то зачем такая подготовка. А потом еще и книга неинтересной окажется...

Автор: ninibel 28.10.2008 - 15:04:41
Трудолюбие будет растрачено впустую на 90% книг, которые будут прочитаны (услышаны) один раз (иногда не до конца - если скучищща или прямой передёр уже известного). А за это трудолюбивое время можно... ого-го чего понаделать.

Автор: Lexus2008 28.10.2008 - 16:51:49
Цитата (Sirr @ 27.10.2008 - 21:04)

Похоже разработчикам нужно Николая поженить с Аленой 
Появятся детки...


Этак мезальянс получится D . Больно уж стар Николай для Аленки.
А детки появляются и в других домах. Внимательнее читайте форум.

Камнями не бросаюсь )

Автор: Sirr 28.10.2008 - 17:04:56
Цитата (Lexus2008 @ 28.10.2008 - 17:38)

Больно уж стар Николай для Аленки.

Ну почему бы тогда молодой Алёнке не научиться более корректно произносить предложения , хотя бы на уровне Николая?

Автор: sm151058 28.10.2008 - 17:10:19
Еще рах мое ХО
Чем отличается восприятие через уши от того же через глаза.
Тем, что через уши инф (текст) идет всегда субъективный, с попыткой тебя интонациями в чем-то убедить. Я долго (неск лет) отучал себя от попыткок найти душу в компьютерном чтении. Сейчас вроде научился воспринимать текст через уши как набор букв и знаков препинания. У Николая даже с удовольствием отмечаю недостатки произношения (как опечатки в текте). Практически не могу слушать аудиокниги в исполнении актеров. Это наглое навязывание собственного прочтения, своего мнения. Лично мне этого не надо. От электрического диктора мне надо четкость и разборчивость.
Николай - почти идеал. Из спорт интереса стараюсь быть в курсе последних достижений, но все больше убеждаюсь, что все разработчики пошли по пути добавления эмоций - отсюда все эти булькания и взвизгивания. Это как читать пьесы с бесконечными ремарками.
Так вот, для Sirr. Прислала мне Сильвия звук файл. Все точно так же булькает , завывает, проглатывает слоги, только в ее темпе (раза в 2 медленне, чем у меня) это проявляется намного сильнее. Алена становится Катериной (в плохом смысле этого слова). Но для Сильвии это нормально, и я нисколько этому не удивлен. Это вопрос психологии восприятия.
Итак, вывод. ИМХО Николай - форервер.

Автор: Sirr 28.10.2008 - 17:44:36
Цитата (sm151058 @ 28.10.2008 - 17:57)

Практически не могу слушать аудиокниги в исполнении актеров.

Аналогично. Мне тоже удобнее самому окрашивать текст эмоциями.
Цитата (sm151058 @ 28.10.2008 - 17:57)

что все разработчики пошли по пути добавления эмоций

Тоже согласен.
На мой взгляд недостатки Николая ( в смысле блеклости звучания голоса) можно скорректировать спец программами , которые стоит позаимствовать у звуко_режиссеров.
Пока, все что мне удалось, это заменить голос Николая на голос Дженифер Лопес )))
Код
http://www.audio4fun.com/
Жаль что это детскя игрушка, но вполне возможно найти более продвинутый её аналог.
Ссылку на такие программы тут давал давал выше, но сам пока не смог разобраться, как этими программами пользоваться.

Автор: trubodur 28.10.2008 - 18:08:01
Цитата (Sirr @ 28.10.2008 - 18:31)


Пока, все что мне удалось, это заменить голос Николая на голос Дженифер Лопес )))

и как звучит образец кинте если можно

Автор: Sirr 28.10.2008 - 19:25:42
Цитата (trubodur @ 28.10.2008 - 18:55)

и как звучит образец кинте если можно

http://files.mail.ru/030Q9F
Тут разные положения движка морфера .
При некоторых навыках, скорее всего можно будет получить нечто удобоваримое и не такое унылое)

Автор: Dickobraz 29.10.2008 - 05:38:50
Цитата (Sirr @ 28.10.2008 - 18:31)

... но вполне возможно найти более продвинутый её аналог.

никто не пробывал
SoX — консольная программа звукового процессинга.
Сайт:
Код
http://sox.sourceforge.net/
Умеет:
Channel averaging, duplication, and removal, Band-pass filter, Band-reject filter, Base tone control, Compress and Expand (compand) the dynamic range of samples, Chorus effect, DCShift audio, Deemphases filter, Move soundstage to front of listener, Add an echo or sequence of echos, Fade in or out, Apply a flanger effect, Apply a high-pass filter, Apply a low-pass filter, Apply an equalizer effect, Add dithering/masking noise to a signal, Multi-band Compander, Pad with silence, Pan sound between channels, Apply a phaser effect, Change the pitch of a sound file without affecting its speed, Repeat audio data, Change sampling rates using several different algorithms, Apply a reverb effect, Reverse sound samples (to search for Satanic messages ), Detect periods of silence and start and stop processing based on it, Change the speed of samples being played (without affecting pitch), Display general stats on sound samples, Stretch/shorten the duration of a sound file, Swap stereo channels, Create sounds with a simple synthesizer, Treble tone control, Trim audio data from beginning and end of file, Apply a tremolo (a.k.a vibrato) effect, Adjust volume of samples, Noise elimination using frequency profiling

я ей темп воспроизведения меняю без изменения тона, но можно и питч сделать и эквалайзер настроить с шумоподавлением...

Автор: Sirr 29.10.2008 - 16:20:15
Попробовал применить стерео-гармонизатор для голоса Николая.
По моему получилось нечто, заслуживающее внимание.
Это первые попытки, так что не судите строго.
http://files.mail.ru/H3U4S2

Автор: Sirr 29.10.2008 - 17:01:10
Цитата (evilone @ 29.10.2008 - 17:33)

машу пальцем не испортишь

Ну зато стерео и голос обогатился гармониками!
А!
Без пяти минут Алёна, но зато предложения строит правильно.
Если ещё случайно поможет местный специалист-звукооператор, так и вообще Коля Алёну переплюнет)
Не находите?

Добавлено: [mergetime]1225293079[/mergetime]
О!
Приношу извинения.
При записи образца голоса торопился и забыл подключить словари ударений Николая)

Автор: zanozza 29.10.2008 - 22:59:21
Имхо, Николай - даже художественно обработанный - не тянет против Аленки, даже с ее шипением после записи в проге мр3book2005. Для Гарри Гаррисона Коля, может, и покатит, но для специальных и научных - увы. Усыпляет своей монотоностью. Лучшее снотворное.

Автор: zanozza 29.10.2008 - 23:14:04
Цитата (Sirr @ 29.10.2008 - 17:48)
Цитата (evilone @ 29.10.2008 - 17:33)

машу пальцем не испортишь

Ну зато стерео и голос обогатился гармониками!
А!
Без пяти минут Алёна, но зато предложения строит правильно.
Если ещё случайно поможет местный специалист-звукооператор, так и вообще Коля Алёну переплюнет)
Не находите?

Добавлено: [mergetime]1225293079[/mergetime]
О!
Приношу извинения.
При записи образца голоса торопился и забыл подключить словари ударений Николая)

Без 5ти часов Алена этот обработанный Николай)

Автор: Sirr 30.10.2008 - 02:47:37
Цитата (zanozza @ 29.10.2008 - 23:46)

Усыпляет своей монотоностью. Лучшее снотворное.

Хмм...
Ну есть тут в муз. редакторах фича такая, что и Коля заикаться по типу Алёны начинает.
Квантизацией это называется.

Неужели рывки внутри предложения будят уставшего слушателя?

Автор: sm151058 2.11.2008 - 17:27:26
Ну, не знаю. Прочитав ваше утверждение еще раз послущал Ольгу и Николая.
У Николая все четко, понятно, без эмоций - чистое, быстрое донесение информации до мозга. У Ольги - паузы, непонятные интонации. отвлекающие от текста, повизгивания. И это самая спокойная из женщин. Лично для меня по донесению текста Ольге до Николая еще далеко. Тут , наверное, важна цель. Если готовишь книги не для себя, то всякого рода виньетки (ложной сути) могут быть полезны. Или если ты хочешь пытаться получать эстетическое наслаждение от произношения разных слов и словосочетаний. Просто для меня - главное - содержание текста, а не его оформление. ИМХО тут Николаю нет равных - все просто и понятно

Автор: Sirr 2.11.2008 - 18:04:35
Цитата (sm151058 @ 2.11.2008 - 18:14)

ИМХО тут Николаю нет равных - все просто и понятно

Попробовал сделать дизайн с голосом Николая.
Стерео, гармонизатор голоса и прочие штучки.
Субъективно стало слушать легче.
Менее надоедлив.

Автор: Lexus2008 2.11.2008 - 18:56:02
Цитата (sm151058 @ 2.11.2008 - 18:14)

У Николая все четко, понятно, без эмоций - чистое, быстрое донесение информации до мозга. У Ольги - паузы, непонятные интонации. отвлекающие от текста, повизгивания. И это самая спокойная из женщин. Лично для меня по донесению текста Ольге до Николая еще далеко.


Всякое суждение основанное на восприятии и привычках, в том числе и мое - субективно. Рекомендуя Ольгу я принимал во внимание технические характеристики голоса. А по ним она безусловнуй лидер. С другой стороны, я рад разнообразию движков, когда каждый может сделать выбор по своему вкусу.
Но утверждения в том, что технологии восмилетней давности лучшие, вызывают всего лишь улыбку laugh

Автор: Kamerer 5.11.2008 - 16:13:36
Sirr

Цитата
Попробовал сделать дизайн с голосом Николая.
Стерео, гармонизатор голоса и прочие штучки.
Субъективно стало слушать легче.
Менее надоедлив.


Поподробнее, если можно ... И на результат можно, как-нибудь взглянуть ?

Автор: Kamerer 5.11.2008 - 17:00:20
Кстати, каким вокодером пользовались ?

Автор: Sirr 5.11.2008 - 21:35:19
Цитата (Kamerer @ 5.11.2008 - 17:47)

каким вокодером пользовались

Сначала audacity голос моно перевёл в стерео с фазовращением, после этого слегка баском украсил с помошью плагина .
Вот что получилось:
http://files.mail.ru/H3U4S2

Автор: Kamerer 6.11.2008 - 19:04:33
Sirr

Спасибо ) ...

P.S. Эх, "Коля" ... "Коля", что ж ты такой горбатый ?!.. нет сил, которые могли бы тебя исправить ( Хотя, есть одно надежное средство ... ))

Автор: Sirr 6.11.2008 - 22:24:28
Коля конечно читает как умеет, зато к нему за эти годы подсобрался достаточно большой словарь ударений и омографов.
По моим наблюдениям , обычный человек привыкает к этому голосу не более 5-10 дней .
Всё зависит от желания.

Автор: sm151058 7.11.2008 - 10:08:57
Цитата (Kamerer @ 6.11.2008 - 19:51)


P.S. Эх, "Коля" ... "Коля", что ж ты такой горбатый



Зато говорит хорошо.
И вообще, я заметил, что если текст интересный, то все замечательно. А если не очень, то возникают всякие нехорошие мысли. Правда, например, Сакраментом , я и хорошие книжки слушать не смог. Про повизгивающих женщин и девушек вообще молчу.
Понравилась сопроводиловка к Катерине
"Катерина девушка молодая и часто волнуется, когда говорит. Она будет говорить намного лучше, если предварительно ЗАМЕНИТЬ в тексте все многоточия, (для неё это означает "нечленораздельность"),
вопросительные и восклицательные знаки, (а у неё - "повизгивание")..."

Автор: ninibel 7.11.2008 - 10:22:57
А вот говорят, что существуют такие вокодеры (не устройства, а программы), которыми можно так менять голос, что чуть ли не преообразовывать мужской голос в женский (якобы ими пользуются эстрадные певцы для придания благозвучия). Может быть вы что-нибудь знаете?

Автор: Sirr 7.11.2008 - 11:01:51
Цитата (ninibel @ 7.11.2008 - 11:09)

вот говорят, что существуют такие вокодеры


Antares_Harmony_Engine_VST-RTAS_1.0
1Autotune.VST.RTAS.TDM.v5.08
AV_VoiceChanger3_0_84
Voice_Tweaker_Pro_DX_v3_02

Можно даже Николая научить заикаться так же, как и Аленку.

Автор: NSS 8.11.2008 - 20:18:41
Баловаться с голосом позволяет также стандартный софт от приличных звуковых карт, не тех что стоят на маме, конечно.

Автор: evilone 10.11.2008 - 23:33:20
кто там просил форум по движкам и прочему безобразию отдельный?
воть пользуйтесь
Код
http://mytts.forum2x2.ru
если чего-то не хватает пишите добавим
зовем всех принять участие.

Автор: Filatov223 11.11.2008 - 01:45:07
evilone!
Это экспортированные из лексикона слова. А где лежит файл, чтоб потом не импортировать?
Добавлено: [mergetime]1226362139[/mergetime]
При прослушивании синтезированных аудиокниг на смартфоне samsung i710, между словами (когда уровень громкости нулевой) возникают щелчки, как буд-то воспроизведение файла выключается а затем снова включается.
Пробовал записывать в разных программах, форматах, качествах И прослушивать в разных плеерах смартфона. Ничего не помогает. Слушать то можно, но щелчки раздражают! Посоветуйте как решить!

Автор: evilone 11.11.2008 - 02:12:43
Filatov223
C:\Documents and Settings\%username%\Application Data\Acapela Group\HW2L\UserLexicons\Alyona22k.dic

Автор: muromzevo 12.11.2008 - 03:06:39
Цитата
С выходом новой версии Алены, в котором будут устранены завывания и лишние звуки, словарный запас для данного движка будет огромен. Поклонников Николая почти не останется.

Когда выйдет тогда и посмотрим. Если не секрет откуда сведения, что идёт работа над новой версией. А может создатели и не подозревают о проблемах которые мы обсуждаем, может они как иностранцы просто не слышат завываний, может для них это языковая норма. А может работа по устранению этого недостатка сравнима с работой по созданию нового движка. А может они содавали движок для автоответчика, а для него он и так хорош. Ну и так далее.
Николая хоронить ещё рано. Девушкам превзойти его не удалось. Шанс на мой взгляд есть у обещанного мужского голоса от Loquendo (сужу по Ольге). Подождём, посмотрим.
До появления новых голосов, сам был не очень высокого мнения о Николае.
Однако оказалось что это очень правильный движок. Очень правильный.

Автор: Lexus2008 12.11.2008 - 12:48:27
muromzevo
Цитата (muromzevo @ 12.11.2008 - 03:53)

Николая хоронить ещё рано. Девушкам превзойти его не удалось.

Это на ваш вкус и привычки. А для меня и не только, Николай давно устарел.
Ну а еще, до сих пор не перевелись фанаты и русских движков от LH rolleyes
Так, что к подобным утверждения уместно добавлять IMHO

Автор: Вика2 12.11.2008 - 13:00:35
Цитата (Lexus2008 @ 12.11.2008 - 13:35)

muromzevo

Цитата (muromzevo @ 12.11.2008 - 03:53)

Николая хоронить ещё рано. Девушкам превзойти его не удалось.

Ну это на ваш вкус и привычки. А для меня и не только, Николай давно устарел.

А для меня и не только лучше Николая пока никого нет
Цитата (Filatov223 @ 10.11.2008 - 21:40)

Поклонников Николая почти не останется.

Как Вы можете говорить за всех? И почему Вы уверенны что Вы окажетесь в большинстве?
Вас послушать, так работу над словарем с Николаем надо бросать и заниматься только Аленами-Ольгами.

уважаемые любители Алены, Алена

Цитата (Lexus2008 @ 12.11.2008 - 13:35)

Ну это на ваш вкус и привычки

Автор: MP3book2005 12.11.2008 - 15:30:52
Цитата (muromzevo @ 12.11.2008 - 03:53)

А может они содавали движок для автоответчика, а для него он и так хорош.

Почти наверняка это так! Компании-разработчики голосовых движков в первую очередь ориентируются на крупные (и главное - ПЛАТЕЖЕСПОСОБНЫЕ) компании использующие голосовые информационные технологии. В подтверждении этого могу сказать, что на сайте DIGALO предлагались только корпоративные продукты, начиная от $8900 за 4 голосовых канала, + еще $800 за каждый дополнительный канал. Использование же синтеза речи для чтения художественной литературы - это для них, так сказать, побочный эффект, поэтому, думаю, что никто специально не будет убирать иностранные интонации ни у Катерины, ни у Алёны...
Нам просто повезло, что фонетическая база для Николая разрабатывалась в Санкт-Питербурге, поэтому в этом голосе французского происхождения из французского только "РРРРР", а интонации наши, родные!

Автор: sm151058 13.11.2008 - 13:04:17
Цитата (Вика2 @ 12.11.2008 - 14:21)
Цитата (Lexus2008 @ 12.11.2008 - 14:02)

А давайте престанем убеждать участников форума в свое правоте. Время само определит лучшее 

Давайте !!! D

По результатам опроса конкурентов у Николая нет (100% голосов - за Николая, и прошу учесть, что только один голос за него - мой, а моя жена в инет не ходит и книжек не слушает)
http://abook-club.ru/forum/index.php?act=ST&f=6&t=20784

Автор: Sylvia 13.11.2008 - 15:10:34
Цитата (sm151058 @ 13.11.2008 - 12:51)

По результатам опроса конкурентов у Николая нет (100% голосов - за Николая, и прошу учесть, что только один голос за него - мой, а моя жена в инет не ходит и книжек не слушает)

D в опросе всего два человека участвовали. clap Хотела проголосовать, но не пойму, как это сделать. Объясните пожалуйста, чайнику sdvig

Автор: MP3book2005 20.11.2008 - 19:07:22
Цитата (dindon @ 20.11.2008 - 19:17)

все (или большинство) найденных недочетов будет устранено.

Самый главный недостаток, который напрочь убивает желание слушать Ольгу - НЕРУССКАЯ интонация в построении предложения. А для того, чтобы это устранить надо быть "носителями языка".

Автор: Lexus2008 22.11.2008 - 17:41:32
Цитата (sm151058 @ 22.11.2008 - 12:23)

Чего вам здесь не нравится, все куда-то уползти хотите.

Мне лично, жутко не нравится николай. А здесь только о нем и базарят.

Автор: sm151058 22.11.2008 - 18:19:18
Так давай про Сашу. Как бы в нем паузы подрегулировать?

Автор: Lexus2008 22.11.2008 - 22:25:30
Цитата (Lexus2008 @ 22.11.2008 - 18:28)

Так давай про Сашу

Не знаком-с с товарищем Сашей.
А зачастую бывает на этот форум и не пробиться.

Автор: Ljudmila 23.11.2008 - 18:47:25
Все перечитала и ничего не поняла. Как мне все же установить эту Ольгу.Тоже хочется.Тем более, что Акунин мне нравится с Николеем, а вот Толстая или Москвина как то не идут, так и хочется, что б тетка какая нибудь читала. Все сделала, как учили, все скачала. Но когда установила, посмотрела, в голосах кроме Николая( да я пользуюсь МП3БООК ) появились какие то Макс и Мари. Причем сам Николай разговаривать отказался. Пришлось удалить пока. эту Ольгу.Но хочется.Научите,где посмотреть поподробнее про установку.

Автор: Stroodder 27.11.2008 - 05:39:46
balabolka
Насчет вопроса "невидимости" Ольги под SAPI5 в Vista. Может что-то в файлах описания самого движка подкрутить можно или в реестре, Вы решения не знаете?

Автор: Nguingm 30.11.2008 - 06:25:27
Цитата (Sirr @ 27.10.2008 - 21:04)

Похоже разработчикам нужно Николая поженить с Аленой
Не знаю, как насчёт поженить, а вот познакомить - это можно.
Вот http://www.sendspace.com/file/6i42gy образец их знакомства в формате mp3(1Мб), а http://www.sendspace.com/file/iqo9nx - полный форматированный текст на два голоса под MP3Book2005 в формате txt (138Кб).
Для прослушивания в настройках MP3Book2005 выставить основной голос - Николай.
Причем заметьте, что характерно - и на Алёне никакого шипения в примере mp3, и Коля читает достаточно эмоционально)
Так что - мир, дружба, жувачька! )

Автор: Sirr 3.12.2008 - 15:12:33
Цитата (MP3book2005 @ 3.12.2008 - 01:27)

Меня просто бесит нерусская интонация этих "девушек".... и артикуляция и интонации АМЕРИКАНСКИЕ.

Что есть то есть.
Хоть Коля и несколько занудлив, но зато говорит по-русски.

Автор: MP3book2005 3.12.2008 - 20:21:28
Цитата (Sirr @ 3.12.2008 - 15:59)

Хоть Коля и несколько занудлив, но зато говорит по-русски.

Может быть именно в безэмоциональности и кроется многолетний успех Николая. Как я уже писал в одном из топиков (применительно к живым чтецам) излишняя эмоциональность, часто, кроме раздражения ничего не вызывает.

Автор: Sirr 3.12.2008 - 21:18:05
Цитата (MP3book2005 @ 3.12.2008 - 21:08)

Как я уже писал в одном из топиков (применительно к живым чтецам) излишняя эмоциональность, часто, кроме раздражения ничего не вызывает.

Вы правы.
С моей точки зрения , именно безэмоциональность Коли и позволяет самому прочитать книгу максимально близко к её бумажному варианту.
Мозг человека очень быстро привыкает сам окрашивать эмоциями услышанное.

Добавлено: [mergetime]1228331907[/mergetime]
Цитата (cation @ 3.12.2008 - 18:37)

Sirr, а как называется блокнот?

Блокнот не совсем благозвучен для русского уха.
Его название "Бред" blink

Автор: Sirr 5.12.2008 - 14:41:55
"В общем Алена конечно человечнее, прикольно даже, а на счет ахов это да )), я запустил, Челюсти Бенчли, как она там хихикала, когда людей акула рвала... в общем придется по старинке, глазами читать, но прогресс конечно присуствует."(с)

Цитирую отзыв человека, познакомившегося с Алёной.

Автор: balabolka 16.12.2008 - 20:44:50
Цитата (flegont @ 16.12.2008 - 12:26)
Кажется, разработчики новых голосовых движков наплевали на корректную поддержку низкоуровневого SAPI4. Alyona - классический пример.

В принципе, согласен, перспектив у SAPI4 нет, но что касается "Алены", то в ноябре этого года на сайт Acapela Group появилась исправленная версия голоса:
Код
http://www.acapela-group.com/download-infovox-desktop-text-to-speech-demo.html
Скачал, поставил поверх старой версии "Алены" - и голос доступен теперь и через SAPI4. Также исправили польскую "Аню" и чешскую "Элишку".

С "Ольгой" в SAPI4 - да, сплошные глюки.

Присоединяюсь к пожеланиям всех благ Денису Буторину, у меня есть его книга.

Автор: MP3book2005 16.12.2008 - 20:59:44
Цитата (balabolka @ 16.12.2008 - 21:21)

появилась исправленная версия голоса

А сам голос не исправили? Иностранные интонации остались или убрали?
Сам я не могу скачать и попробовать, так стоит ли тревожить друзей со скоростным Интернетом, чтобы они мне ее скачали?

Автор: Тортила 16.12.2008 - 22:02:39
Цитата (MP3book2005 @ 16.12.2008 - 21:36)

стоит ли тревожить друзей со скоростным Интернетом, чтобы они мне ее скачали

Я купил у тебя прогу и испробовал с новой Аленой и Николаем. В среднем все же Алена приятнее на слух, хоть и делает больше ошибок. Бывают моменты, что слово просто не удается понять. Мне кажется тебе стоит ориентироваться на нее.

Автор: balabolka 16.12.2008 - 23:17:28
Цитата (MP3book2005 @ 16.12.2008 - 21:36)
А сам голос не исправили? Иностранные интонации остались или убрали?

Не заметил никакой разницы в звуках речи или интонациях. Размер дистрибутива голоса "Алена" остался почти такой же, так что вряд ли были сделаны какие-либо изменения.

Автор: SergeiSP 24.12.2008 - 20:37:58
Привет. Вы уже, наверное, много двигов перепробовали, подскажите, какой оптимально ставить Николай, Алена, Ольга, Катерина 2, Sakrament 3? Главное, чтоб было оптимально грамотное звучание и ударения, естественно с имеющимися словарями? Просто ставить все сразу и проверять не оптимальный вариант, потом систему вычищать и реестр чистить.

Автор: flegont 24.12.2008 - 22:06:22
ИМХО Nicolai от Elan, Olga от Loquento wink

Автор: flegont 25.12.2008 - 13:01:43
ЗЫ. Не знаю, как там с Sakrament 3 обстоят дела, а связавшись с Sakrament 2 я сильно об этом пожалел. Мало того, что эти разухабистые "голоса" лично мне оказались противны, так после штатной сакраментовской деинсталляции побилась Windows! Пришлось "Восстановление системы" делать, бо удалены оказались не только файлы Сакрамента, но и dll-ки, отвечавшие в виндах за работу компонента RichEdit ranting2

Автор: flegont 2.01.2009 - 13:16:14
В ночь с 1-го на 2-е Генваря ) скачал с сайта Acapela Group Алену 2.210

В сам дель, исправили. Под SAPI4 теперь работает. clap Дал ей текстик в 1.5 мб, с которым Николай Еланыч справляется запросто. Обновленная Аленка тож не оплошала. Все чин чином - слежение за чтением, регулировка скорости.

ЗЫ. Для проверки движков пользую две простейшие тестовые читалки: из книжки Д.Буторина - для SAPI4; из статьи Брайана Лонга - для SAPI5.

ЗЫ.ЗЫ. Кстати, в этих играх эмпирически обнаружен факт, что под SAPI5 любой движок ограничен максимальным размером читаемого текста ровно в 1Мб!
А под SAPI4 - зависит от движка.
Николай и исправленная Алена разом заглатывают до 2Мб. Это позволяет наполнятьтекст управляющими тегами (любой подходящей утилитой), без опасений, что чтение небольшими блоками (Говорилка, Балаболка, EXO и т.п.) "порубит" теги и читалка выдаст ошибку.
Ольга, также, как старые L&H голоса - глотает разом не более 64 Кб.

Интере-е-сно... sdvig

Автор: msw1 20.01.2009 - 23:34:39
После установки "Ольги" в доверенной эоне прописалась такая бяка

ProtocolDefaults: '@ivt' protocol is in My Computer Zone, should be Intranet Zone (HKLM) и ее ничем не вытравишь . И ещё когда отключаюсь от инета "Ольга" перестаёт работать , опять запрашивает регистрацию.Подскажите это нормально или только у меня так

Автор: Вика2 21.01.2009 - 00:24:29
Это происходит видимо из-за того что Ольга не зарегистрированна или зарегистрированна неправильно.
На всякий случай напоминаю - вопросы вареза здесь не обсуждаются.

Автор: sm151058 21.01.2009 - 17:14:09
Послушал я в очередной раз этих девушек (правдв, у меня они зарегистрированы, значит, женщин), на разных скоростях. Тщательно. И в очередной раз удивился, что есть люди, для которых это конкуренты Николаю. Какие все-таки люди разные. У Николая все четко, ровно, как вода в ручейке. Неправильности воспринимаются как опечатки в тексте (у женщин почему-то воспринимаются как эмоции, и это напрягает). Есть картавость, но с кем не бывает. Будто книгу читаешь, никто тебе не взвизгнет, не взвоет, не навяжет своего мнения. ИМХО - только Николай.

Автор: flegont 21.01.2009 - 19:01:18
Цитата
Будто книгу читаешь, никто тебе не взвизгнет, не взвоет, не навяжет своего мнения. ИМХО - только Николай.

Склонен согласиться ) Хотя Ольга, IMHO, вобщем, неплоха. Другое дело, что чтение мужским голосом, само по себе, лучше воспринимается... Подождем, пока Loquento сотворит обещанный мужской голос. Что-то там у них выйдет? wink

Автор: sm151058 22.01.2009 - 15:09:09
Цитата (flegont @ 21.01.2009 - 19:38)
[. Другое дело, что чтение мужским голосом, само по себе, лучше воспринимается... Подождем, пока Loquento сотворит обещанный мужской голос. Что-то там у них выйдет? wink

ИМХО дело не поле чтеца а в том, что у Николая найдена золотая середина между красивостью и механичностью. Для коротких фрагентов новые женские голоса хороши, но для больших твкстов лично мне не подходят. Живых чтецов не люблю еще больше,чем Алену и тп, они еще более эмоцинальны, в т ч и мужчины.

Автор: NADIN415 29.01.2009 - 10:32:41
Прочитала тут все посты и не понимаю - что, на Говорилке свет клином сошелся?
Она из записывающих самая неудобная и видит только один движок.
Есть еще по крайней мере 4 программы для записи книг, без этих сложных манипуляций (а для прослушивания и больше).
1. ABoo,
2. KooBAudio,
Эти две бесплатные;
3. MP3book2005 (платная - 300 р.),
Эти программы воспринимаю много движков, установив их на ПК, можно просто выбрать нужный в настройках программы для записи.
Книгу большую в 1,5 Мб записывают за 1-1,5 часа.
Мне, например, больше нравится голосовой движок Алена. Она имеет свой настраиваемый словарь и Программу для записи, и на мой взгляд вполне приличный результат получается.

Если хотите дам все ссылки.

Автор: OlegLord 29.01.2009 - 11:28:38
По поводу программ полностью согласен, особенно вторая хороша.
А вот насчет Алены не понял, какая такая программа для записи?

Автор: Logna 29.01.2009 - 22:16:07
Алена- голосовой движок, голос очень приятный, но достаточно сложно настроить словари, с этим движком работают программы ICE Book Reader, Cool Reader и Balabolka, с помощью последней можно и записывать книги в mp3

Автор: flegont 30.01.2009 - 09:25:00
IMHO, самый лучший из женских голосов на сегодня - это Loquento Olga )

P.S. А "Говорилка", действительно, давно пройденный этап в развитии говорящих прог. Автору - респект за изобретение формата DIC для словарей произношения и пожелания здоровья и жизненных успехов. D

P.P.S. После появления книги Д. Буторина "MS Agent и Speech API в Delphi" (2005 г) и статей Б. Лонга (2003г) - говорящие проги на Delphi не пишет только ленивый p. Списываешь у Буторина, получаешь "Demagog" (SAPI4). Списываешь у Лонга - будет "EXO" (SAPI5). Списываешь у обоих - "Balabolka" (SAPI4+SAPI5)...
И только "MP3book2005" написан (если ничего не путаю) на Visual Basic - автору видать, пришлось покорпеть. Зато по функционалу сие изделие, IMHO, самое удачное, и. так сказать, "вылизанное" ) Недостатки: 1) платная регистрация 2) работает только под SAPI5.

Автор: Logna 30.01.2009 - 12:52:31
У Ольги четкое произношение, но явственный прибалтийский ( почему-то) акцент,
к тому же для нее нет словарей произношения, т.е. она не обучается.

Автор: flegont 30.01.2009 - 13:21:21
Через словарь DIC - обучается. В качестве знака ударения используем апостроф (или ^ ) перед ударной гласной.
А что прибалтийка - это да. Недостаток. wink

Автор: balabolka 3.02.2009 - 19:43:41
Цитата (flegont @ 30.01.2009 - 10:02)
После появления книги Д. Буторина "MS Agent и Speech API в Delphi" (2005 г) и статей Б. Лонга (2003г) - говорящие проги на Delphi не пишет только ленивый  p. Списываешь у Буторина, получаешь "Demagog" (SAPI4). Списываешь у Лонга - будет "EXO" (SAPI5). Списываешь у обоих - "Balabolka" (SAPI4+SAPI5)...

Хм, можно подумать, что это Буторин и Лонг на пару написали Speech API (Денис Николаевич - 4-ую версию, Брайн - 5-ую)... wink

То есть, слово "списывать" здесь не совсем уместно, так как тогда и Буторин с Лонгом тоже "списали" свои примеры с программ из "Microsoft Speech SDK". Они разобрались с документацией и примерами из SAPI SDK, перевели примеры с C++ на Delphi, выложили свои наработки в сеть в удобоваримой форме, с подробными комментариями - спасибо им за это большое. И если я пишу в основном на Delphi, то зачем мне примеры на C++ из SDK, если есть такие же примеры работы с SAPI на Delphi?! Это лишь вопрос удобства восприятия информации. (SAPI SDK тоже рекомендую скачать - хотя бы ради файла справки sapi.chm).

Конечно, ничего сложного в работе с компьютерными голосами через SAPI нет; для того и писался этот API - чтобы ОБЛЕГЧИТЬ жизнь разработчикам программ. Но перечисленные Вами программы содержат и другие интересные функции; стоит обратить внимание и на это...

Автор: flegont 3.02.2009 - 20:51:43
Цитата
и Буторин с Лонгом тоже "списали" свои примеры


Конечно! Буторин вообще великий списыватель, это я без насмешки говорю. Проработал кучу документации по SAPI4, перевел на русиш добротно, портировал примеры с Си на Дельфи. Почти все примеры из его книжки - по настоящему рабочие. Так что слово "списал" я употребляю в положительном смысле: "использовал проверенный, опубликованный открыто алгоритм, с пользой для дела и без ошибок" )

ЗЫ. А Speech SDK 5.1 действительно, штука полезная, не только из-за справки, но и ради примеров на VB. Аналогии с Дельфи достаточно прозрачные, чтобы понять, как Лонг в одном месте лоханулся ges_slap

ЗЫ.ЗЫ. Перечисленные мной программы, да, имеют (каждая свои) интересные фишки и, в какой-то мере, дополняют друг друга.

Автор: sergo71 13.02.2009 - 14:43:25
Пользовался некоторое время программой "Балаболка".Как мне показалось это лучшее из говорящих движков. Но долго не прослушал с ней.Искусственный и не живой звук не доставлял удовольствия при прослушивание аудиокниг. dunno Пришлось удалить и слушать по "старинке" с живыми чтецами.

Автор: flegont 13.02.2009 - 22:04:27
Путаете, товарисч. Балаболка - НЕ движок, а программа-оболочка для использования голосвых движков, уже установленных на Вашем компе. Как и любая другая "говорящая программа". Ежели кроме бесплатных L&H голосов на нем ничего больше не установлено, то и получите говорящих роботов )

Автор: NSS 15.02.2009 - 21:53:37
Loquento Olga имеет возможность исправления неправильных слов? Говорит она получше других, но ошибки делает там где другие не делают.

Автор: garin 16.02.2009 - 01:55:00
Лучше Ольги работает Acapela Alyona SAPI-5 с программой Text to Speech Maker.

Автор: sergo71 16.02.2009 - 17:05:54
Цитата (flegont @ 13.02.2009 - 22:41)
Ежели кроме бесплатных L&H голосов на нем ничего больше не установлено, то и получите говорящих роботов )

А что там можно ещё установить? Мне нужна была эта прога только для прослушивания текста.

Автор: flegont 16.02.2009 - 20:16:06
У меня установлены, кроме L&H мужского и женского голосов: Elan Nikolai, Acapela Alyona 2.210, Katerina 2, Loquento Olga.

Автор: sergo71 16.02.2009 - 21:32:22
Цитата (flegont @ 16.02.2009 - 20:53)
У меня установлены, кроме L&H мужского и женского голосов: Elan Nikolai, Acapela Alyona 2.210, Katerina 2, Loquento Olga.

А что это по вашему не говорящие роботы? По большому счёту они все одинаково звучат. К сожалению не естественно. confused

Автор: flegont 17.02.2009 - 20:02:24
Не одинаково )

Автор: Logna 17.02.2009 - 22:17:37
Все голосовые движки абсолютно разные, а Alyona очень близка к человеческому голосу, если поработать со словарями над ударениями, практически живой голос.
С ее помощью можно "латать" сбойные участки аудиокниг

Автор: Сережа28 18.02.2009 - 01:05:34
Logna, подскажите пожалуйста,где и как скачать
Acapela Alyona SAPI-5 с программой Text to Speech Maker.???
Зараннее СПАСИБО!

Автор: NSS 18.02.2009 - 15:46:33
Цитата (Сережа28 @ 18.02.2009 - 01:42)

подскажите пожалуйста,где и как скачать
Acapela Alyona SAPI-5 с программой Text to Speech Maker.???

да очень просто. Набираем в гугле запрос: Acapela Alyona SAPI-5
и качаем где нравится.

Автор: SergeiSP 18.02.2009 - 19:05:32
Подскажите, какой словарь оптимальный для Ольги? Я так понимаю, что под Ольгу можно заточить любой словарь из под Николая, но их довольно много, какой лучше выбрать?

Автор: alex2 19.02.2009 - 03:35:12
Цитата
Подскажите, какой словарь оптимальный для Ольги? Я так понимаю, что под Ольгу можно заточить любой словарь из под Николая, но их довольно много, какой лучше выбрать?

зайдите вот сюда:
Код
http://mytts.forum2x2.ru

Автор: Logna 21.02.2009 - 14:56:49
так это здорово, что есть возможность слушать Николая, а если не нравится- Алену или еще кого, главное - есть выбор. Можно было бы и образцы звучания разных движков ( при одном и том же тексте) поместить там где чтецы и ничего страшного,
может кому-то нужно газету читать или книгу, до которой еще никто из профи не добрался

Автор: downunder 22.02.2009 - 12:09:57
Цитата (NADIN415 @ 29.01.2009 - 11:09)
Если хотите дам все ссылки.

Оччень интересно!!!! А вот пожалуйста дайте линки handup

Автор: flegont 22.02.2009 - 14:46:15
Образцы звучания Николая, Катерины-2, Алены и Ольги на одном и том же тексте есть, например, здесь:
Код
http://aloys.narod.ru/demagog.htm

Автор: Logna 22.02.2009 - 21:09:45
Большое спасибо за возможность сравнить голоса,
единственно что могу добавить- Катерина у меня звучит намного лучше и
именно этот движок не только мне, но и моим знакомым дал отдых глазам,
дал возможность при чтении переходить в режим прослушивания.
Надо эти образцы поставить ниже образцов чтецов, но все же оставить в постоянном пользовании, иначе эта ссылка затеряется

Автор: flegont 22.02.2009 - 21:28:37
Звучание зависит от звуковой карты, что установлена на компьютере. Я замечал, что один и тот же голос на разных компьютерах (например, дома и на работе) звучит по-разному.
С Катериной обращает на себя внимание тот факт, что она ставит ударения намного правильней всех остальных движков. Так что можно обойтись без словаря. Кстати, не знаю, существуют ли словари для Катерины?

Автор: Logna 22.02.2009 - 22:09:44
существует очень маленький, могу прислать.
Катерина совместно с Cool Reader дали возможность записать и прослушать
очень много книг слепому человеку
и даже ее вопросительные интонации, вернее озвучивание вопросительных знаков не умаляли основного- более человеческого звучания.
А сейчас- Алена

Автор: mindwin 14.04.2009 - 21:39:54
Одни и те же голосовые движки говорят (звучат) по разному из-за разных версий Speech API.
Проверено лично.

Автор: kestrel 31.08.2009 - 19:45:41
У loquendo появился братец Ольги - Dmitri.
Код
http://www.loquendo.com/en/audio/Dmitri2.mp3

Автор: Iudushka 31.08.2009 - 19:53:56
очень по-моему ничего. на первый т.е. укус

Автор: Eug_Nik 31.08.2009 - 20:28:18
По моему при правильной настройке вообще от живых не отличить. Даже эмоции имитируют.

Дмитрий уже сейчас лучше некоторых "чтецов" , через пару лет только проффесиональным актерам будет уступать bee art

Автор: drYY 31.08.2009 - 21:25:08
Попробовал Алёну - весьма недурна по сравнению с Николаем есть шаг вперёд. Но это только на вскидку, надо целиком книгу заглотить, тогда ясно станет..

Автор: Iudushka 1.09.2009 - 10:14:04
я того...в цитатник снесу
Цитата (drYY @ 31.08.2009 - 23:13)

Попробовал Алёну - весьма недурна по сравнению с Николаем есть шаг вперёд


Автор: MP3book2005 1.09.2009 - 12:53:10
Цитата (kestrel @ 31.08.2009 - 21:33)

появился братец Ольги - Dmitri.

И как Ольга , Дмитрий той-же национальности - иностранной. Интонации даже в демо-версии всё равно нерусские, хотя тембр голоса приятный. В такой коротенькой демке (наверняка специально подготовленной для рекламы) несколько раз слова налезали друг на друга, чем и грешила сестричка...
Так что какого-либо существенного програсса лично я не наблюдаю... dunno

Автор: Iudushka 1.09.2009 - 15:42:45
Цитата (MP3book2005 @ 1.09.2009 - 14:41)

(наверняка специально подготовленной для рекламы)

а как же!
Цитата (MP3book2005 @ 1.09.2009 - 14:41)

тембр голоса приятный

думаю его еще очень даже можно сделать пониже

Автор: MP3book2005 2.09.2009 - 12:22:37
Цитата (eugnik @ 31.08.2009 - 22:16)

Даже эмоции имитируют.

Вспомнился вопрос к сексопатологам - нужно ли имитировать оргазм?
Аналогично возникает вопрос - а нужно ли имитировать эмоции? Фальш сразу чувствуется и только ухудшает восприятие.
Цитата (eugnik @ 31.08.2009 - 22:16)

Дмитрий уже сейчас лучше некоторых "чтецов"

Если имеются ввиду начинающие самодеятельные чтецы Клуба - полностью согласен! Некоторых из них слушать скучнее, чем компьютер... dunno
Если не верите, зайдите в тему "Проба голоса".

Автор: MP3book2005 2.09.2009 - 16:56:35
Цитата (Iudushka @ 1.09.2009 - 17:30)

Цитата (MP3book2005 @ 1.09.2009 - 14:41)

(наверняка специально подготовленной для рекламы)



а как же!


Помнится, рекламная демка Алёны совсем не соответствовала реальному голосу... dunno
Так что, когда услышим реального Дмитрия, наверняка нас будет ждать очередное разочарование. -(

Автор: Igrek 4.09.2009 - 15:31:04
Что вы скажете о таких книгах? Конечно,Пушкина или Гоголя электронный голос не прочтёт как следует,но познавательную литературу (типа-"Хочу всё знать" или лекции по определённой тематике ) может.Едешь в автобусе на работу целый час и слушаешь.Зрение не портится .

Автор: Light 4.09.2009 - 18:37:44
Igrek
А Вы загляните вот сюда:
http://abook-club.ru/forum/index.php?showforum=40

Автор: MP3book2005 23.04.2010 - 01:17:05
Центром речевых технологий (СПб) скоро будут выпущены новые голосовые движки VitalVoice .
Вот ссылка на демонстрацию
Код
http://vitalvoice.speechpro.com/index.php?mode=play

Немного разочаровывает слишком сильное акцентирование знаков препинания, но в целом звучание голосов приятное.

Автор: kio 23.04.2010 - 01:59:43
голоса хорошие.
художественный текст читается все так же паскудно - булькает, глотаются окончания слов, акцентируется там, где бог на душу положит
впрочем, за сцылку все равно спасибо: сейчас сочиню какую-нибудь складную похабщину, пусть декламируют, как умеют write

Автор: Нойзик 3.10.2010 - 18:57:26
Господа, да у вас тут, пусть не большая, но война = )))

Тем не менее, приятно читать и совсем не скучно изучать ваши разные мнения касательно того или иного движка.

Некоторые из вас и вовсе стали этакими профи синтезированной речи, которые отличают акцент и прочие мелочи…

Я для себя понял одно: какой движок есть, такой, почти, и останется, несмотря на различные ухищьрения. Да, словари заставляют эллектронного «чтеца» ставить правильное ударение, произность звуки… НО, давайте смотреть правде в глаза – изменения эти не значительны.

Тоесть, я хочу сказать, что речь определенного движка не станет лучше, чем речь другого движка, улучшившись лишь косметичискими исправлениями. Отсюда получается, что выбирать движок, из существующих на сегодняшний день, следует без внимания на всякие апгрейды в виде народных словарей и прочего. Софт тоже любой подойдет и не важно Болоболка это или Говорилка…

Уделять внимание выбору софта, тона, скорости, словаря и т.д. следует уже после того, как вы ВЫБРАЛИ движок, которым будете пользоваться.

Теперь приступим к выбору движка…

Для чего мы вообще устанавливаем это на свой комп? Ответ – чтобы слушать. Вот именно, ЧТОБЫ СЛУШАТЬ РЕЧЬ. И мне честно говоря непонятно, когда некоторые из вас начинают меряться достоинством движков обращая внимание на такие вещи как скорость записи в мр3, скорость чтения и прочее. Ну это же бред, верно? Либо люди просто выбирают движок НЕ для приятного прослушивания, а для второстепенных плюшек, которые можно без проблем выполнить любым аудио-редактором. Я правда не знаю, возможно скорость записи и чтения зависят только от программы, а не движка, но суть вы поняли.

Итак, мы не привязаны к выбору софта (пока что), нас не интересуют дополнительные возможности, нам ВАЖНО чтобы просто можно было ПРИЯТНО СЛУШАТЬ.

Ассортимент следующий: (перечисляю примерно в порядке от старых к новым) Николай, Катерина, Ольга, Дмитрий, Алена. Все да? Вроде никого не забыл. А если и забыл – значит это ерунда, а не движок, который и забыть не стыдно.

И вот тут я просто не понимаю большинство из вас (вплодь до того, что перечитываю посты по второму разу, полагая что ошибочно прочитал), так как предпочтение отдаете тому же Николаю, отправляя более новые технологии в отстойник!

Говорю сразу, я лицо незаинтересованное. Единственный мой интерес – это чтобы звучало хорошо.

Слушал я от Николая до Фестиваля и понимал что между ними огромная разница. Та же Алена более человечнее читает, чем те первые синтезаторы речи аля Николай. Речь от роботоподобной потихоньку переходит к человеческой. Объясните мне, может я дурак, почему люди не слазят с Николая? Привычка что ли? Или это все они большинство, а те кто слушает Алену/Олю – меньшинство? Правда, не понимаю. Я вот другу, который не знает что такое синтез, скинул запись Николая, так он сказал «Ты че робота купил? Ахахаха!». А другому аналогичному другу скинул Алену, так он и не прочь был бы телефончик её узнать = ))

Не в коем случае никому не в обиду. Примите за ИМХО

Автор: EvgenPriest 3.10.2010 - 19:31:24
Согласен с kio-голоса уже ближе к истине но всё равно не то, а про правильные акценты я вообще молчу, как от железки можно такого хотеть?
Как ни крути человек пока не заменим в деле декламации, я в таком исполнении слушать всё равно не буду, либо читать либо ждать пока выйдет более менее нормальный релиз пусть и любительский, благо что хороших любителей становится всё больше и больше...

Автор: garin 20.10.2010 - 21:50:24
К сожалению лучше Николая, никто не делает ударение и интонацию, а так же правильно выполняет указания словарей! Алена не правильно, выполняет указания словарей, не выполняет правильно ударение и прожевывает слова, к ней нельзя привыкнуть!

Автор: evmir1 6.01.2011 - 19:54:04
Цитата (garin @ 20.10.2010 - 20:03:24)

Алена не правильно, выполняет указания словарей, не выполняет правильно ударение и прожевывает слова, к ней нельзя привыкнуть!

Вы не правы! Вы её хоть слушали? Возможно у Вас не подключены лексиконы, не словари, а именно лексиконы. Они разработаны специально для Алёны, если хотите, я могу выслать их Вам. wink

Автор: mike2003 22.02.2011 - 16:57:48
кстати после Николая Алена жукто напрягает бульканьем и проглатыванием
дайте пожалуйста инструкцию по настройке и пример голоса как оно может звучать в умелых руках!
первый раз ее только попробовал )

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)