Ответ в темуСоздание новой темыСоздание опроса

> Книжный рынок читают роботы, В РФ развиваются технологии озвучивания аудиокниг через ИИ
 logvin Пользователя сейчас нет на форуме
Отправлено: 26.01.2023 - 19:58:32 (post in topic: 1, link to post #916314)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Moderators
Сообщений: 9045
Поблагодарили: 30430
Ай-яй-юшек: 11
Штраф:(0%) -----

user posted image

Российские книжные сервисы и издательства начали активно внедрять технологии искусственного интеллекта (ИИ) для озвучивания аудиокниг. В перспективе такие алгоритмы могут помочь в разы ускорить и удешевить производство в сегменте, надеются участники рынка, увеличив продажи. Но эксперты отмечают, что технология пока не может полноценно заменить диктора и подходит не для всех типов литературы.

Книжный сервис «Строки» (принадлежит МТС) в 2023 году планирует озвучить более 10 тыс. произведений с помощью искусственного интеллекта разработки подразделения MTS AI, рассказали “Ъ” в компании. На первом этапе в работе уже находятся 600 произведений.

Книги будут записываться с помощью платформы Audiogram, в основе которой используются нейронные сети, машинное обучение и технологии обработки естественного языка (NLP).

Она позволяет синтезировать речь, расставлять ударения и паузы, воспроизводить вопросительные, побудительные и другие интонации, уточнили в МТС. Инвестиции в проект не раскрываются.

Лидер рынка аудиокниг — ГК «ЛитРес» (сервисы «ЛитРес», MyBook, Livelib и др.) также развивает озвучивание аудиокниг с помощью ИИ, говорит директор департамента по развитию контента группы Евгений Селиванов: «Такую озвучку мы запустили еще осенью 2020 года, но активно использовать начали осенью 2022 года. Она основана на технологии распознавания и синтеза речи SpeechKit, на которой работает голосовой помощник "Алиса" (развивает "Яндекс".— “Ъ”)». В «Яндексе» подтверждают растущий спрос на технологии ИИ в облаке для озвучивания самых разных текстов: «С помощью упомянутой технологии SpeechKit в 2022 году было озвучено более 100 тыс. часов аудиокниг».

В 2022 году «ЛитРес» записал и выпустил около 6 тыс. книг, озвученных «живыми» голосами, но «авточтецы» озвучили сразу 3 тыс. книг за два месяца. Себестоимость озвучки одной книги с помощью ИИ составляет 400–700 руб., уточнил Евгений Селиванов: «Алгоритм позволяет производить в несколько раз больше книг за период, чем распределенная команда чтецов». В отличие от стандартной роботизированной озвучки, по его словам, ИИ запоминает паузы, отмеченные редактором, расставляя их самостоятельно, что позволяет избежать искажений.

Сейчас более 90% книг на российском рынке не имеют аудиоверсии, говорят в МТС, а их трансформация в аудиоформат, по оценке компании, традиционным способом «заняла бы годы».

«На подготовку первоначальной версии аудиокниг с помощью ИИ уходит около 30–60 минут, тогда как студийная запись живым голосом занимает до нескольких дней с учетом технической обработки и монтажа»,— пояснили в МТС. Собеседник “Ъ”, близкий к компании, уточнил, что расходы на озвучивание одной единицы контента за счет ИИ сокращаются «минимум в десять раз». По его словам, работа диктора стоит от 50 тыс. руб. за книгу.

Как экосистемы интегрируют книжные сервисы в свои подписки
С ИИ экспериментируют и издательства. Президент «Эксмо-АСТ» Олег Новиков говорит, что группа использует ИИ в том числе для прогнозирования тиража допечаток, анализа потенциала рукописи на основе данных о прошлых продажах.

Руководитель аудиопроектов Alpina Digital (группа «Альпина») Николай Боронин рассказал, что компания озвучила 86 книг из своего портфеля с помощью ИИ: «Но нельзя сказать, что это стало регулярной практикой. Даже хороший искусственный интеллект не может полноценно заменить диктора. Такой голос несовершенен, что может негативно сказываться на продажах». Придирчивые слушатели могут избегать аудиокниг в исполнении ИИ из-за недостатка естественного интонирования, считает он.
Очевидно, что технология пока несовершенна: чтобы выйти на по-настоящему большие объемы и отвечать за итоговое качество, необходимо дополнительно размечать текст, добавляя ударения сложным словам, а также помогая ИИ правильно интонировать книги, объясняет господин Селиванов.

По его словам, «ЛитРес» планирует в 2023 году усовершенствовать процесс записи: «Пользователи очень благожелательно относятся к озвучке роботами, если не сталкиваются с проблемами неправильных ударений или интонаций, поэтому активное развитие книжной отрасли в этом направлении очевидно».

Код
Доступно только для зарегистрированных пользователей


 


--------------------
Если Вы зарегистрированы на нашем форуме, то Вы читали Правила Форума и обязались их исполнять!

Если Вы их не исполняете - то не обижайтесь на действия модератора!
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Поручик, vicky000000, Iudushka, krokik, AliBaba, Rom165, olegbz, Вася с Марса
 Arsss Пользователя сейчас нет на форуме
Отправлено: 26.01.2023 - 20:32:27 (post in topic: 2, link to post #916316)
Цитировать сообщение Цитировать выделенный текст


Новый Товарищ
*
Профиль
Группа: Members
Сообщений: 109
Поблагодарили: 166
Ай-яй-юшек: 6
Штраф:(0%) -----

Ждите нейросеть, говорящую голосами известных людей. Бесовщина уже рисует.

Это сообщение отредактировал Arsss - 26.01.2023 - 20:32:48
PMПисьмо на e-mail пользователю
Bottom Top
 vicky000000 Пользователя сейчас нет на форуме
Отправлено: 26.01.2023 - 23:11:41 (post in topic: 3, link to post #916327)
Цитировать сообщение Цитировать выделенный текст


Рука раздающего
живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 22177
Поблагодарили: 99706
Ай-яй-юшек: 120
Штраф:(0%) -----

Цитата (Arsss @ 26.01.2023 - 20:32:27)

Бесовщина уже рисует

И это полхо... почему?
PMПисьмо на e-mail пользователюСайт пользователя
Bottom Top
 Iudushka Пользователя сейчас нет на форуме
Отправлено: 26.01.2023 - 23:56:18 (post in topic: 4, link to post #916329)
Цитировать сообщение Цитировать выделенный текст


Gold
виновен :(
Group Icon
Профиль
Группа: Administrators
Сообщений: 27903
Поблагодарили: 39498
Ай-яй-юшек: 125

Это мировой тренд.
Восхитительные озвучки предлагает нейросеть в сервисах Apple
Код
Доступно только для зарегистрированных пользователей

Добавлено:
Но тут нет предмета сравнения. И, наверное, не будет.


--------------------
посвящаю созданную данным текстом заслугу благу всех живых существ ©
PMПисьмо на e-mail пользователюСайт пользователяICQAOL
Bottom Top
 Поблагодарили за полезное сообщение: krokik, AliBaba
 krokik Пользователя сейчас нет на форуме
Отправлено: 27.01.2023 - 01:05:24 (post in topic: 5, link to post #916332)
Цитировать сообщение Цитировать выделенный текст


Заслуженый АбуканецGold
Свинье Не Товарищ
Group Icon
Профиль
Группа: Privileged
Сообщений: 27444
Поблагодарили: 46508
Ай-яй-юшек: 339
Штраф:(20%) X----

Интересно, когда-нибудь научатся делать хорошо обратный переход - с голоса на текст? В некоторых конференсных апликухах (таких как "Teams") оставляешь голосовое сообщение, которое приходит коллеге на мейл в виде текста. Это понятно, что движок имеет проблемы с моим неизличимым акцентом, но ведь он порой выдает от самих ностителей английского такое, что диву даешься.


--------------------
Бегемот - птица гордая! Пока не пнешь - не полетит
PMПисьмо на e-mail пользователю
Bottom Top
 AliBaba Пользователя сейчас нет на форуме
Отправлено: 27.01.2023 - 02:27:28 (post in topic: 6, link to post #916340)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 5818
Поблагодарили: 10687
Ай-яй-юшек: 83
Штраф:(0%) -----

Цитата (krokik @ 26.01.2023 - 17:05:24)
Интересно, когда-нибудь научатся делать хорошо обратный переход - с голоса на текст? .......  он порой выдает от самих ностителей английского такое, что диву даешься.

Это потому, что люди говорить не умеют D

Цитата (Iudushka @ 26.01.2023 - 15:56:18)
Восхитительные озвучки предлагает нейросеть в сервисах Apple

Мне очень понравилось, а жена говорит шарма не хватает. Там, кстати, написано, что начитано программой, но на основе реального чтеца (чтицы). Думаю, не за горами время, когда появится сервис типа Spotify, в которым можно прослушать абсолютно любую книгу, хоть и Поваренную D в исполнении, скажем, цифрового Литвинова, или Князева или даже Герасимова.

В тему: рекомендую прослушать первый час книги Макса Тегмарка «Жизнь 3.0. Быть человеком в эпоху искусственного интеллекта».
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Rom165, vicky000000
 Rom165 Пользователя сейчас нет на форуме
Отправлено: 27.01.2023 - 10:54:39 (post in topic: 7, link to post #916354)
Цитировать сообщение Цитировать выделенный текст


Gold
Профессиональный любитель
Group Icon
Профиль
Группа: Privileged
Сообщений: 4241
Поблагодарили: 10383
Ай-яй-юшек: 24
Штраф:(0%) -----

Цитата (AliBaba @ 27.01.2023 - 02:27:28)
Думаю, не за горами время, когда появится сервис типа Spotify, в которым можно прослушать абсолютно любую книгу, хоть и Поваренную  в исполнении, скажем, цифрового Литвинова, или Князева или даже Герасимова.

Исполнители уже волнуются

У дикторов крадут голоса


Представители отрасли просят о регулировании технологий синтеза речи
...
Союз дикторов просит Госдуму установить специальное регулирование синтеза человеческого голоса с помощью технологий искусственного интеллекта (ИИ). Дикторы говорят о случаях кражи их голосов и опасаются снижения доходов на фоне распространения технологий. Предлагается, в частности, ввести лицензии на использование определенного голоса. Компании, синтезирующие речь, говорят, что заботятся о легитимности технологии. Но юристы подтверждают, что голос никак не защищен от копирования.

Код
Доступно только для зарегистрированных пользователей


--------------------
user posted image
Если почти нечего сказать это еще не повод заткнуться © Michel Auiard

user posted image

"Какая же ты дура, мой ангел" - из письма А.С. Пушкина жене...
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: AliBaba, vicky000000, krokik, Naina Kievna
 Iudushka Пользователя сейчас нет на форуме
Отправлено: 27.01.2023 - 12:23:34 (post in topic: 8, link to post #916363)
Цитировать сообщение Цитировать выделенный текст


Gold
виновен :(
Group Icon
Профиль
Группа: Administrators
Сообщений: 27903
Поблагодарили: 39498
Ай-яй-юшек: 125

Цитата (AliBaba @ 27.01.2023 - 03:27:28)

Мне очень понравилось, а жена говорит шарма не хватает

И я в восторге. А шарм еще добавится - нет сомнений.
Цитата (AliBaba @ 27.01.2023 - 03:27:28)

когда появится сервис типа Spotify, в которым можно прослушать абсолютно любую книгу

Эпл уже отдает любую книгу из своей библиотеки. Выбираешь - и она звучит.

А вот Спотифай аудиокниги - сейчас очень неудобный. ОЧЕНЬ.
Получается дорого, каталог кривой, подписки вообще нет. Они целятся в Амазон, но пока не получается.


--------------------
посвящаю созданную данным текстом заслугу благу всех живых существ ©
PMПисьмо на e-mail пользователюСайт пользователяICQAOL
Bottom Top
 Поблагодарили за полезное сообщение: AliBaba, vicky000000
 Поручик Пользователя сейчас нет на форуме
Отправлено: 27.01.2023 - 13:27:09 (post in topic: 9, link to post #916368)
Цитировать сообщение Цитировать выделенный текст


GoldМастер художественного слова
Злой либерал-механицист
Group Icon
Профиль
Группа: Privileged
Сообщений: 9885
Поблагодарили: 29078
Ай-яй-юшек: 32
Штраф:(0%) -----

Цитата (Iudushka @ 27.01.2023 - 13:23:34)
А шарм еще добавится - нет сомнений.

Не могу промолчать, уж не взыщите cool
Для шарма у книги есть ТЕКСТ diablo


--------------------
Соблюдайте технику безопасности.
1 В технике безопасности не работает презумпция невиновности
2 Заводящий с тобой разговор про политику может оказаться провокатором или доносчиком (см п.1)
PMПисьмо на e-mail пользователюСайт пользователя
Bottom Top
 Поблагодарили за полезное сообщение: vicky000000, Iudushka
 Алькон Пользователя сейчас нет на форуме
Отправлено: 27.01.2023 - 16:35:20 (post in topic: 10, link to post #916374)
Цитировать сообщение Цитировать выделенный текст


Друг, Товарищ и Брат
****
Профиль
Группа: Members
Сообщений: 1049
Поблагодарили: 1324
Ай-яй-юшек: 23
Штраф:(0%) -----

Цитата (Поручик @ 27.01.2023 - 14:27:09)

Для шарма у книги есть ТЕКСТ diablo

Есть же море неозвученных книг. Есть книги художественные, которые так озвучивают люди, что лучше бы они их не озвучивали вообще(. Есть книги нехудожественные, в конце концов. Море таких хороших книг, что для слушателей сейчас также недоступны. И не будут - у чтецов не хватит времени физически, про финансовую сторону этого дела, которая также существенна, молчу.

Пусть будет до кучи, Поручик)


--------------------
С наилучшими пожеланиями,
автор и литературный агент
Максим В. Глазунов,
сайт: glazynov.github.io
rutube-канал: rutube.ru/channel/24798542
youtube-канал: youtube.com/channel/UCiGiSKxqUFK5I4EFWj63d3w
PM
Bottom Top
 Поблагодарили за полезное сообщение: Iudushka, AliBaba
 AliBaba Пользователя сейчас нет на форуме
Отправлено: 28.01.2023 - 02:38:11 (post in topic: 11, link to post #916396)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 5818
Поблагодарили: 10687
Ай-яй-юшек: 83
Штраф:(0%) -----

Цитата (Алькон @ 27.01.2023 - 08:35:20)
Есть же море неозвученных книг. Есть книги художественные, которые так озвучивают люди, что лучше бы они их не озвучивали вообще(.

А компьютеры озвучат ВСЁ совершенно замечательно и голосом вашего любимого исполнителя D Надеюсь скромно еще дожить до этого D Не, ну понятно, что живые чтецы будут лучше фонограмы, но для обычного ежедневного потребителя эта разница в качестве несущественна ИМХО.

Профессия переводчика технических текстов с разных языков (я этим зарабытывал на провиант в 80-х начале 90-х) уже убита. Компьютеры переводят очень хорошо. Если есть вопрос о тонкостях - обращайтесь к билингву-специалисту в этой области. Наверняка есть много других специальностей-работ, которые были полностью заменены компьютерами за последние 20 лет.

Так же будет убита в ближайшее время профессия исполнителей аудиокниг ИМХО. Ну, то есть, для ценителей человеческого голоса будет небольшой рынок и цены!
Ребята, это не против вас! Это просто попытка понять куды мы идем.

А вы пробовали читать искусственных сочинителей рассказов? Ты им задаешь канву, а они ее потом развивают. Я пробовал. Академиям ведьм (если их еще люди сочиняют) с ними тягаться будет тяжело. Да и другим масс-производителям текстов тоже D

И это только начало. )
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: vicky000000, Iudushka
 vicky000000 Пользователя сейчас нет на форуме
Отправлено: 29.01.2023 - 23:19:03 (post in topic: 12, link to post #916455)
Цитировать сообщение Цитировать выделенный текст


Рука раздающего
живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 22177
Поблагодарили: 99706
Ай-яй-юшек: 120
Штраф:(0%) -----

user posted image

user posted image
PMПисьмо на e-mail пользователюСайт пользователя
Bottom Top
 Поблагодарили за полезное сообщение: Iudushka, Rom165, trya, krokik
 logvin Пользователя сейчас нет на форуме
Отправлено: 31.01.2023 - 20:22:53 (post in topic: 13, link to post #916517)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Moderators
Сообщений: 9045
Поблагодарили: 30430
Ай-яй-юшек: 11
Штраф:(0%) -----

У дикторов крадут голоса
Представители отрасли просят о регулировании технологий синтеза речи

Союз дикторов просит Госдуму установить специальное регулирование синтеза человеческого голоса с помощью технологий искусственного интеллекта (ИИ). Дикторы говорят о случаях кражи их голосов и опасаются снижения доходов на фоне распространения технологий. Предлагается, в частности, ввести лицензии на использование определенного голоса. Компании, синтезирующие речь, говорят, что заботятся о легитимности технологии. Но юристы подтверждают, что голос никак не защищен от копирования.

“Ъ” ознакомился с копией письма Союза дикторов России главе комитета Госдумы по информполитике Александру Хинштейну от 26 января. Дикторы предлагают в нем разработать регулирование синтеза голосов с помощью ИИ. В союзе подтвердили подлинность письма, господин Хинштейн заявил “Ъ”, что пока его не получал.

Речь идет о технологиях, которые копируют голос человека на основе звуковой записи и позволяют в дальнейшем использовать его в голосовых помощниках, онлайн-синтезаторах и пр.

В перспективе получить синтезированную речь станет дешевле, чем записать диктора, и многие голосовые артисты лишатся работы, считают авторы письма.

Дикторы в письме рассказывают о фактах «кражи» голоса с помощью ИИ: «Нет ни норм, ни практики, ни понимания, как писать претензию. Заказчики ссылаются на договор, в котором есть пункты про отчуждение прав, право на переработку и право передачи третьим лицам».

Члены союза предлагают закрепить запрет на отчуждение прав исполнителей при использовании голосового синтеза и перейти на лицензионные договоры «с четко определенным сроком действия», как в сфере защиты прав на товарный знак. Также предлагается закрепить норму о том, что запись синтезированного голоса может использоваться только в конкретном проекте.

Михаил Мишустин, премьер РФ, 2 сентября 2021 года (цитата по ТАСС):

«Можно сколько угодно говорить о том, что роботы вытеснят какие-то специальности, заменят людей. Не соглашусь с этим».

ИИ-инструменты начинают активно внедряться для озвучивания аудиокниг, сообщал “Ъ” 23 января: участники рынка рассчитывают, что это удешевит и ускорит процесс их производства. «Издательствам нужна хорошая озвучка по приемлемой цене, дикторам — сохранение профессии, которой многие отдали годы»,— говорит руководитель аудиопроектов Alpina Digital Николай Боронин. У владельца или разработчика ИИ должен быть договор на использование голоса, однако от прямого пиратства никто не застрахован, признает он.

В издательской группе «Эксмо-АСТ» считают, что опасения дикторов «не в полной мере оправданны». Сервис «Яндекса» SpeechKit, с которым сотрудничает группа, заключает договоры с диктором, на основе голоса которого синтезируется речь, говорят в пресс-службе группы. Кроме того, без личного участия специалиста, чей голос отобран по специальным параметрам, невозможно добиться качества автоматического озвучивания, добавляют в группе.

Глава VS Robotics (занимается решениями на базе речевых технологий) Дмитрий Теплицкий рассказал, что в теории синтезировать речь определенного человека можно и без многочасовой записи: «У нас есть опыт создания голосов знаменитых личностей на основе записей спектаклей, отрывков из фильмов, публичных выступлений. Здесь важно, чтобы записи были как можно более чистыми и сопровождались текстовой расшифровкой». Но для создания нового голоса для TTS (text-to-speech, преобразование текста в речь) компания все же отбирает дикторов и записывает их живой голос продолжительностью от пяти часов. Гендиректор ЦРТ Дмитрий Дырмовский отмечает, что компании-лидеры в области речевых технологий уделяют внимание легитимности его применения «и в целом этике ИИ».

Голос невозможно защитить от «копирования»: если имитирование само по себе совершается без преступного умысла, то за такое использование даже ответственности не предусмотрено, говорит управляющий партнер Enterprise Legal Solutions Юрий Федюкин:

«Понять дикторов можно, но с точки зрения закона реализация их инициативы невозможна просто в силу того, что законом защищается не голос, а фонограмма, созданная с его применением».

Внесение изменений в российское законодательство, которые могли бы сделать это возможным, не имеет смысла, полагает Юрий Федюкин, поскольку обрабатывать фонограммы дикторов тогда просто будут в других странах.

Код
Доступно только для зарегистрированных пользователей


--------------------
Если Вы зарегистрированы на нашем форуме, то Вы читали Правила Форума и обязались их исполнять!

Если Вы их не исполняете - то не обижайтесь на действия модератора!
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: vicky000000, krokik, AliBaba, Поручик
 Iudushka Пользователя сейчас нет на форуме
Отправлено: 1.02.2023 - 16:11:13 (post in topic: 14, link to post #916552)
Цитировать сообщение Цитировать выделенный текст


Gold
виновен :(
Group Icon
Профиль
Группа: Administrators
Сообщений: 27903
Поблагодарили: 39498
Ай-яй-юшек: 125

О!
Запретить. Неожиданно.


--------------------
посвящаю созданную данным текстом заслугу благу всех живых существ ©
PMПисьмо на e-mail пользователюСайт пользователяICQAOL
Bottom Top
 Поручик Пользователя сейчас нет на форуме
Отправлено: 1.02.2023 - 16:42:42 (post in topic: 15, link to post #916555)
Цитировать сообщение Цитировать выделенный текст


GoldМастер художественного слова
Злой либерал-механицист
Group Icon
Профиль
Группа: Privileged
Сообщений: 9885
Поблагодарили: 29078
Ай-яй-юшек: 32
Штраф:(0%) -----

Вот кому-то халтурка - разработать средство измерений и методику для экспертизы punk


--------------------
Соблюдайте технику безопасности.
1 В технике безопасности не работает презумпция невиновности
2 Заводящий с тобой разговор про политику может оказаться провокатором или доносчиком (см п.1)
PMПисьмо на e-mail пользователюСайт пользователя
Bottom Top
 Поблагодарили за полезное сообщение: siv2
 Макыс Пользователя сейчас нет на форуме
Отправлено: 8.02.2023 - 22:32:48 (post in topic: 16, link to post #916739)
Цитировать сообщение Цитировать выделенный текст


ваш друг, "Пиши-читай"
Group Icon
Профиль
Группа: Privileged
Сообщений: 3224
Поблагодарили: 4078
Ай-яй-юшек: 2
Штраф:(0%) -----

Смоктуновского скопировали?
Думаю будет видно,т.Е. слышно сразу, что это ИИ-без мозгов


--------------------
Ты заходи,если что(с)
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Naina Kievna



1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:

Опции темы Ответ в темуСоздание новой темыСоздание опроса
 
  


Анклавы Клуба в социальных сетях:
Клуб любителей Аудиокниг - Твиттер  Клуб на ФейсБук  Клуб любителей Аудиокниг - наш канал на YouTube  Канал Клуба Любителей Аудиокниг в Телеграм