Книжный рынок читают роботы :: Клуб Любителей АудиоКниг

Клуб Любителей АудиоКниг · Текстовая версия форума · Правила · Рецензии · Трекер · Файлообмен · Перейти в Наш Каталог

Помощь

Поиск

Здравствуйте Гость ( Вход | Регистрация )

Выслать повторно письмо для активации

Блокировка сайта Клуба на территории РФ

Лучшие книги ушедшего года. Авторские подборки

Клуб Любителей АудиоКниг -> Новости. Наши-Ваши - все -> С миру по нитке -> Книжный рынок читают роботы

Книжный рынок читают роботы, В РФ развиваются технологии озвучивания аудиокниг через ИИ

Подписка на тему | Сообщить другу | Версия для печати | Добавить/Удалить из избранных

logvin

Отправлено: 26.01.2023 - 19:58:32 (post in topic: 1, link to post #916314)

живу я здесь...
Group Icon

Профиль
Группа: Moderators
Сообщений: 9045
Поблагодарили: 30430
Ай-яй-юшек: 11
Штраф:(0%)

Российские книжные сервисы и издательства начали активно внедрять технологии искусственного интеллекта (ИИ) для озвучивания аудиокниг. В перспективе такие алгоритмы могут помочь в разы ускорить и удешевить производство в сегменте, надеются участники рынка, увеличив продажи. Но эксперты отмечают, что технология пока не может полноценно заменить диктора и подходит не для всех типов литературы.

Книжный сервис «Строки» (принадлежит МТС) в 2023 году планирует озвучить более 10 тыс. произведений с помощью искусственного интеллекта разработки подразделения MTS AI, рассказали “Ъ” в компании. На первом этапе в работе уже находятся 600 произведений.

Книги будут записываться с помощью платформы Audiogram, в основе которой используются нейронные сети, машинное обучение и технологии обработки естественного языка (NLP).

Она позволяет синтезировать речь, расставлять ударения и паузы, воспроизводить вопросительные, побудительные и другие интонации, уточнили в МТС. Инвестиции в проект не раскрываются.

Лидер рынка аудиокниг — ГК «ЛитРес» (сервисы «ЛитРес», MyBook, Livelib и др.) также развивает озвучивание аудиокниг с помощью ИИ, говорит директор департамента по развитию контента группы Евгений Селиванов: «Такую озвучку мы запустили еще осенью 2020 года, но активно использовать начали осенью 2022 года. Она основана на технологии распознавания и синтеза речи SpeechKit, на которой работает голосовой помощник "Алиса" (развивает "Яндекс".— “Ъ”)». В «Яндексе» подтверждают растущий спрос на технологии ИИ в облаке для озвучивания самых разных текстов: «С помощью упомянутой технологии SpeechKit в 2022 году было озвучено более 100 тыс. часов аудиокниг».

В 2022 году «ЛитРес» записал и выпустил около 6 тыс. книг, озвученных «живыми» голосами, но «авточтецы» озвучили сразу 3 тыс. книг за два месяца. Себестоимость озвучки одной книги с помощью ИИ составляет 400–700 руб., уточнил Евгений Селиванов: «Алгоритм позволяет производить в несколько раз больше книг за период, чем распределенная команда чтецов». В отличие от стандартной роботизированной озвучки, по его словам, ИИ запоминает паузы, отмеченные редактором, расставляя их самостоятельно, что позволяет избежать искажений.

Сейчас более 90% книг на российском рынке не имеют аудиоверсии, говорят в МТС, а их трансформация в аудиоформат, по оценке компании, традиционным способом «заняла бы годы».

«На подготовку первоначальной версии аудиокниг с помощью ИИ уходит около 30–60 минут, тогда как студийная запись живым голосом занимает до нескольких дней с учетом технической обработки и монтажа»,— пояснили в МТС. Собеседник “Ъ”, близкий к компании, уточнил, что расходы на озвучивание одной единицы контента за счет ИИ сокращаются «минимум в десять раз». По его словам, работа диктора стоит от 50 тыс. руб. за книгу.

Как экосистемы интегрируют книжные сервисы в свои подписки
С ИИ экспериментируют и издательства. Президент «Эксмо-АСТ» Олег Новиков говорит, что группа использует ИИ в том числе для прогнозирования тиража допечаток, анализа потенциала рукописи на основе данных о прошлых продажах.

Руководитель аудиопроектов Alpina Digital (группа «Альпина») Николай Боронин рассказал, что компания озвучила 86 книг из своего портфеля с помощью ИИ: «Но нельзя сказать, что это стало регулярной практикой. Даже хороший искусственный интеллект не может полноценно заменить диктора. Такой голос несовершенен, что может негативно сказываться на продажах». Придирчивые слушатели могут избегать аудиокниг в исполнении ИИ из-за недостатка естественного интонирования, считает он.
Очевидно, что технология пока несовершенна: чтобы выйти на по-настоящему большие объемы и отвечать за итоговое качество, необходимо дополнительно размечать текст, добавляя ударения сложным словам, а также помогая ИИ правильно интонировать книги, объясняет господин Селиванов.

По его словам, «ЛитРес» планирует в 2023 году усовершенствовать процесс записи: «Пользователи очень благожелательно относятся к озвучке роботами, если не сталкиваются с проблемами неправильных ударений или интонаций, поэтому активное развитие книжной отрасли в этом направлении очевидно».

Код

Доступно только для зарегистрированных пользователей

--------------------

Если Вы зарегистрированы на нашем форуме, то Вы читали Правила Форума и обязались их исполнять!

Если Вы их не исполняете - то не обижайтесь на действия модератора!

Поблагодарили за полезное сообщение: Поручик, vicky000000, Iudushka, krokik, AliBaba, Rom165, olegbz, Вася с Марса

Arsss

Отправлено: 26.01.2023 - 20:32:27 (post in topic: 2, link to post #916316)

Новый Товарищ

Профиль
Группа: Members
Сообщений: 109
Поблагодарили: 166
Ай-яй-юшек: 6
Штраф:(0%)

Ждите нейросеть, говорящую голосами известных людей. Бесовщина уже рисует.

Это сообщение отредактировал Arsss - 26.01.2023 - 20:32:48

vicky000000

Отправлено: 26.01.2023 - 23:11:41 (post in topic: 3, link to post #916327)

живу я здесь...
Group Icon

Профиль
Группа: Privileged
Сообщений: 22177
Поблагодарили: 99706
Ай-яй-юшек: 120
Штраф:(0%)

Цитата (Arsss @ 26.01.2023 - 20:32:27)

Бесовщина уже рисует

И это полхо... почему?

Iudushka

Отправлено: 26.01.2023 - 23:56:18 (post in topic: 4, link to post #916329)

виновен :(
Group Icon

Профиль
Группа: Administrators
Сообщений: 27903
Поблагодарили: 39498
Ай-яй-юшек: 125

Это мировой тренд.
Восхитительные озвучки предлагает нейросеть в сервисах Apple

Код

Доступно только для зарегистрированных пользователей

Добавлено:
Но тут нет предмета сравнения. И, наверное, не будет.

--------------------

посвящаю созданную данным текстом заслугу благу всех живых существ ©

Поблагодарили за полезное сообщение: krokik, AliBaba

krokik

Отправлено: 27.01.2023 - 01:05:24 (post in topic: 5, link to post #916332)

Свинье Не Товарищ
Group Icon

Профиль
Группа: Privileged
Сообщений: 27444
Поблагодарили: 46508
Ай-яй-юшек: 339
Штраф:(20%) X----

Интересно, когда-нибудь научатся делать хорошо обратный переход - с голоса на текст? В некоторых конференсных апликухах (таких как "Teams") оставляешь голосовое сообщение, которое приходит коллеге на мейл в виде текста. Это понятно, что движок имеет проблемы с моим неизличимым акцентом, но ведь он порой выдает от самих ностителей английского такое, что диву даешься.

--------------------

Бегемот - птица гордая! Пока не пнешь - не полетит

AliBaba

Отправлено: 27.01.2023 - 02:27:28 (post in topic: 6, link to post #916340)

живу я здесь...
Group Icon

Профиль
Группа: Privileged
Сообщений: 5818
Поблагодарили: 10687
Ай-яй-юшек: 83
Штраф:(0%)

Цитата (krokik @ 26.01.2023 - 17:05:24)

Интересно, когда-нибудь научатся делать хорошо обратный переход - с голоса на текст? ....... он порой выдает от самих ностителей английского такое, что диву даешься.

Это потому, что люди говорить не умеют

Цитата (Iudushka @ 26.01.2023 - 15:56:18)

Восхитительные озвучки предлагает нейросеть в сервисах Apple

Мне очень понравилось, а жена говорит шарма не хватает. Там, кстати, написано, что начитано программой, но на основе реального чтеца (чтицы). Думаю, не за горами время, когда появится сервис типа Spotify, в которым можно прослушать абсолютно любую книгу, хоть и Поваренную

в исполнении, скажем, цифрового Литвинова, или Князева или даже Герасимова.

В тему: рекомендую прослушать первый час книги Макса Тегмарка «Жизнь 3.0. Быть человеком в эпоху искусственного интеллекта».

Поблагодарили за полезное сообщение: Rom165, vicky000000

Rom165

Отправлено: 27.01.2023 - 10:54:39 (post in topic: 7, link to post #916354)

Профессиональный любитель
Group Icon

Профиль
Группа: Privileged
Сообщений: 4241
Поблагодарили: 10383
Ай-яй-юшек: 24
Штраф:(0%)

Цитата (AliBaba @ 27.01.2023 - 02:27:28)

Думаю, не за горами время, когда появится сервис типа Spotify, в которым можно прослушать абсолютно любую книгу, хоть и Поваренную в исполнении, скажем, цифрового Литвинова, или Князева или даже Герасимова.

Исполнители уже волнуются

У дикторов крадут голоса

Представители отрасли просят о регулировании технологий синтеза речи
...
Союз дикторов просит Госдуму установить специальное регулирование синтеза человеческого голоса с помощью технологий искусственного интеллекта (ИИ). Дикторы говорят о случаях кражи их голосов и опасаются снижения доходов на фоне распространения технологий. Предлагается, в частности, ввести лицензии на использование определенного голоса. Компании, синтезирующие речь, говорят, что заботятся о легитимности технологии. Но юристы подтверждают, что голос никак не защищен от копирования.

Код

Доступно только для зарегистрированных пользователей

--------------------

Если почти нечего сказать это еще не повод заткнуться © Michel Auiard

"Какая же ты дура, мой ангел" - из письма А.С. Пушкина жене...

Поблагодарили за полезное сообщение: AliBaba, vicky000000, krokik, Naina Kievna

Iudushka

Отправлено: 27.01.2023 - 12:23:34 (post in topic: 8, link to post #916363)

виновен :(
Group Icon

Профиль
Группа: Administrators
Сообщений: 27903
Поблагодарили: 39498
Ай-яй-юшек: 125

Цитата (AliBaba @ 27.01.2023 - 03:27:28)

Мне очень понравилось, а жена говорит шарма не хватает

И я в восторге. А шарм еще добавится - нет сомнений.

Цитата (AliBaba @ 27.01.2023 - 03:27:28)

когда появится сервис типа Spotify, в которым можно прослушать абсолютно любую книгу

Эпл уже отдает любую книгу из своей библиотеки. Выбираешь - и она звучит.

А вот Спотифай аудиокниги - сейчас очень неудобный. ОЧЕНЬ.
Получается дорого, каталог кривой, подписки вообще нет. Они целятся в Амазон, но пока не получается.

--------------------

посвящаю созданную данным текстом заслугу благу всех живых существ ©

Поблагодарили за полезное сообщение: AliBaba, vicky000000

Поручик

Отправлено: 27.01.2023 - 13:27:09 (post in topic: 9, link to post #916368)

Злой либерал-механицист
Group Icon

Профиль
Группа: Privileged
Сообщений: 9885
Поблагодарили: 29078
Ай-яй-юшек: 32
Штраф:(0%)

Цитата (Iudushka @ 27.01.2023 - 13:23:34)

А шарм еще добавится - нет сомнений.

Не могу промолчать, уж не взыщите cool

Для шарма у книги есть ТЕКСТ diablo

--------------------

Соблюдайте технику безопасности.
1 В технике безопасности не работает презумпция невиновности
2 Заводящий с тобой разговор про политику может оказаться провокатором или доносчиком (см п.1)

Поблагодарили за полезное сообщение: vicky000000, Iudushka

Алькон

Отправлено: 27.01.2023 - 16:35:20 (post in topic: 10, link to post #916374)

Друг, Товарищ и Брат

Профиль
Группа: Members
Сообщений: 1049
Поблагодарили: 1324
Ай-яй-юшек: 23
Штраф:(0%)

Цитата (Поручик @ 27.01.2023 - 14:27:09)

Для шарма у книги есть ТЕКСТ diablo

Есть же море неозвученных книг. Есть книги художественные, которые так озвучивают люди, что лучше бы они их не озвучивали вообще(. Есть книги нехудожественные, в конце концов. Море таких хороших книг, что для слушателей сейчас также недоступны. И не будут - у чтецов не хватит времени физически, про финансовую сторону этого дела, которая также существенна, молчу.

Пусть будет до кучи, Поручик)

--------------------

С наилучшими пожеланиями,
автор и литературный агент
Максим В. Глазунов,
сайт: glazynov.github.io
rutube-канал: rutube.ru/channel/24798542
youtube-канал: youtube.com/channel/UCiGiSKxqUFK5I4EFWj63d3w

Поблагодарили за полезное сообщение: Iudushka, AliBaba

AliBaba

Отправлено: 28.01.2023 - 02:38:11 (post in topic: 11, link to post #916396)

живу я здесь...
Group Icon

Профиль
Группа: Privileged
Сообщений: 5818
Поблагодарили: 10687
Ай-яй-юшек: 83
Штраф:(0%)

Цитата (Алькон @ 27.01.2023 - 08:35:20)

Есть же море неозвученных книг. Есть книги художественные, которые так озвучивают люди, что лучше бы они их не озвучивали вообще(.

А компьютеры озвучат ВСЁ совершенно замечательно и голосом вашего любимого исполнителя

Надеюсь скромно еще дожить до этого

Не, ну понятно, что живые чтецы будут лучше фонограмы, но для обычного ежедневного потребителя эта разница в качестве несущественна ИМХО.

Профессия переводчика технических текстов с разных языков (я этим зарабытывал на провиант в 80-х начале 90-х) уже убита. Компьютеры переводят очень хорошо. Если есть вопрос о тонкостях - обращайтесь к билингву-специалисту в этой области. Наверняка есть много других специальностей-работ, которые были полностью заменены компьютерами за последние 20 лет.

Так же будет убита в ближайшее время профессия исполнителей аудиокниг ИМХО. Ну, то есть, для ценителей человеческого голоса будет небольшой рынок и цены!
Ребята, это не против вас! Это просто попытка понять куды мы идем.

А вы пробовали читать искусственных сочинителей рассказов? Ты им задаешь канву, а они ее потом развивают. Я пробовал. Академиям ведьм (если их еще люди сочиняют) с ними тягаться будет тяжело. Да и другим масс-производителям текстов тоже

И это только начало.

Поблагодарили за полезное сообщение: vicky000000, Iudushka

vicky000000

Отправлено: 29.01.2023 - 23:19:03 (post in topic: 12, link to post #916455)

живу я здесь...
Group Icon

Профиль
Группа: Privileged
Сообщений: 22177
Поблагодарили: 99706
Ай-яй-юшек: 120
Штраф:(0%)

Поблагодарили за полезное сообщение: Iudushka, Rom165, trya, krokik

logvin

Отправлено: 31.01.2023 - 20:22:53 (post in topic: 13, link to post #916517)

живу я здесь...
Group Icon

Профиль
Группа: Moderators
Сообщений: 9045
Поблагодарили: 30430
Ай-яй-юшек: 11
Штраф:(0%)

У дикторов крадут голоса
Представители отрасли просят о регулировании технологий синтеза речи

Союз дикторов просит Госдуму установить специальное регулирование синтеза человеческого голоса с помощью технологий искусственного интеллекта (ИИ). Дикторы говорят о случаях кражи их голосов и опасаются снижения доходов на фоне распространения технологий. Предлагается, в частности, ввести лицензии на использование определенного голоса. Компании, синтезирующие речь, говорят, что заботятся о легитимности технологии. Но юристы подтверждают, что голос никак не защищен от копирования.

“Ъ” ознакомился с копией письма Союза дикторов России главе комитета Госдумы по информполитике Александру Хинштейну от 26 января. Дикторы предлагают в нем разработать регулирование синтеза голосов с помощью ИИ. В союзе подтвердили подлинность письма, господин Хинштейн заявил “Ъ”, что пока его не получал.

Речь идет о технологиях, которые копируют голос человека на основе звуковой записи и позволяют в дальнейшем использовать его в голосовых помощниках, онлайн-синтезаторах и пр.

В перспективе получить синтезированную речь станет дешевле, чем записать диктора, и многие голосовые артисты лишатся работы, считают авторы письма.

Дикторы в письме рассказывают о фактах «кражи» голоса с помощью ИИ: «Нет ни норм, ни практики, ни понимания, как писать претензию. Заказчики ссылаются на договор, в котором есть пункты про отчуждение прав, право на переработку и право передачи третьим лицам».

Члены союза предлагают закрепить запрет на отчуждение прав исполнителей при использовании голосового синтеза и перейти на лицензионные договоры «с четко определенным сроком действия», как в сфере защиты прав на товарный знак. Также предлагается закрепить норму о том, что запись синтезированного голоса может использоваться только в конкретном проекте.

Михаил Мишустин, премьер РФ, 2 сентября 2021 года (цитата по ТАСС):

«Можно сколько угодно говорить о том, что роботы вытеснят какие-то специальности, заменят людей. Не соглашусь с этим».

ИИ-инструменты начинают активно внедряться для озвучивания аудиокниг, сообщал “Ъ” 23 января: участники рынка рассчитывают, что это удешевит и ускорит процесс их производства. «Издательствам нужна хорошая озвучка по приемлемой цене, дикторам — сохранение профессии, которой многие отдали годы»,— говорит руководитель аудиопроектов Alpina Digital Николай Боронин. У владельца или разработчика ИИ должен быть договор на использование голоса, однако от прямого пиратства никто не застрахован, признает он.

В издательской группе «Эксмо-АСТ» считают, что опасения дикторов «не в полной мере оправданны». Сервис «Яндекса» SpeechKit, с которым сотрудничает группа, заключает договоры с диктором, на основе голоса которого синтезируется речь, говорят в пресс-службе группы. Кроме того, без личного участия специалиста, чей голос отобран по специальным параметрам, невозможно добиться качества автоматического озвучивания, добавляют в группе.

Глава VS Robotics (занимается решениями на базе речевых технологий) Дмитрий Теплицкий рассказал, что в теории синтезировать речь определенного человека можно и без многочасовой записи: «У нас есть опыт создания голосов знаменитых личностей на основе записей спектаклей, отрывков из фильмов, публичных выступлений. Здесь важно, чтобы записи были как можно более чистыми и сопровождались текстовой расшифровкой». Но для создания нового голоса для TTS (text-to-speech, преобразование текста в речь) компания все же отбирает дикторов и записывает их живой голос продолжительностью от пяти часов. Гендиректор ЦРТ Дмитрий Дырмовский отмечает, что компании-лидеры в области речевых технологий уделяют внимание легитимности его применения «и в целом этике ИИ».

Голос невозможно защитить от «копирования»: если имитирование само по себе совершается без преступного умысла, то за такое использование даже ответственности не предусмотрено, говорит управляющий партнер Enterprise Legal Solutions Юрий Федюкин:

«Понять дикторов можно, но с точки зрения закона реализация их инициативы невозможна просто в силу того, что законом защищается не голос, а фонограмма, созданная с его применением».

Внесение изменений в российское законодательство, которые могли бы сделать это возможным, не имеет смысла, полагает Юрий Федюкин, поскольку обрабатывать фонограммы дикторов тогда просто будут в других странах.

Код

Доступно только для зарегистрированных пользователей

--------------------