Ответ в темуСоздание новой темыСоздание опроса

> Ученый ТГУ озадачил искусственный интеллект словами-омографами
 logvin Пользователя сейчас нет на форуме
Отправлено: 26.10.2020 - 21:23:16 (post in topic: 1, link to post #885377)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Moderators
Сообщений: 9044
Поблагодарили: 30428
Ай-яй-юшек: 11
Штраф:(0%) -----

user posted image

Доцент кафедры теоретических основ информатики института прикладной математики и компьютерных наук Томского госуниверситета (ИПМКНТГУ) Михаил Пожидаев занимается созданием библиотеки для обработки слов-омографов в русском языке; библиотека необходима для автоматического создания аудиокниг, сообщает в понедельник пресс-служба вуза.

Пресс-служба напоминает, что слова-омографы – это слова, которые совпадают в написании, но различаются в произношении. Например, существительное "пОтом" ("обливаясь пОтом") и наречие "потОм" ("как выяснилось потОм"). При переводе текстов в аудиоформат искусственный интеллект не способен автоматически найти правильное звучание слова, что затрудняет доступ к текстам, в том числе техническим, для слабовидящих людей.

"Создание библиотеки для обработки омографов (Михаилом Пожидаевым) напрямую связано с компьютерной лингвистикой. Сейчас во время учебного процесса школьники и студенты с нарушениями зрения часто сталкиваются с рядом неточностей в автоматической обработке текстов на русском языке. Те же проблемы встречают и прочие слушатели аудиокниг", – поясняется в сообщении актуальность проблемы.

По словам Пожидаева, которого цитирует пресс-служба, в настоящий момент даже синтезаторы речи именитых производителей продолжают ошибаться с выбором ударения, не говоря уже о синтезаторах, находящихся в свободном доступе. Решением проблемы занимаются специалисты в области компьютерной лингвистики. Ученый опирается на собственный опыт погружения в проблему – вследствие болезни ученый полностью лишился зрения.

В русском языке почти 30 тысяч слов-омографов. Нюанс библиотеки для их обработки в том, что когда контексты собраны, можно провести повторный анализ тех же самых текстов и посмотреть, не прослеживается ли статистическая закономерность использования тех же самых контекстов, но без морфологической неопределенности. Однако для этого нужно обработать колоссальные объемы информации, что требует огромных вычислительных мощностей, поясняется в сообщении.

"К счастью, у нас есть достаточный набор средств понизить вычислительную сложность. Если научиться решать такую задачу, этим можно пользоваться и для снятия других типов неоднозначности. Например, для определения склонения дат, денежных сумм и так далее. Для работы с морфологией слов очень помог проект aot.ru Алексея Сокирко и его коллег", – отмечает Пожидаев.

Код
Доступно только для зарегистрированных пользователей


 


--------------------
Если Вы зарегистрированы на нашем форуме, то Вы читали Правила Форума и обязались их исполнять!

Если Вы их не исполняете - то не обижайтесь на действия модератора!
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Mozly, vicky000000, AliBaba, Rom165, Koss, krivbasua, Поручик, kremen55, Eug_Nik, Vasab
 Макыс Пользователя сейчас нет на форуме
Отправлено: 27.10.2020 - 16:10:54 (post in topic: 2, link to post #885427)
Цитировать сообщение Цитировать выделенный текст


ваш друг, "Пиши-читай"
Group Icon
Профиль
Группа: Privileged
Сообщений: 3224
Поблагодарили: 4078
Ай-яй-юшек: 2
Штраф:(0%) -----

ИИ (интеллект кого?)- потОм? или пОтом?
Говорилка - птм -- да. По прежнему говорилка. Конкуренции с живым человеком по прежнему нет.
ОК-гугл!
Спасибо тебе и всем остальным ИИ


--------------------
Ты заходи,если что(с)
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Вася с Марса, Iudushka
 6002011 Пользователя сейчас нет на форуме
Отправлено: 28.10.2020 - 05:43:20 (post in topic: 3, link to post #885457)
Цитировать сообщение Цитировать выделенный текст


Убийца смысла


Профиль
Группа: Members
Сообщений: -20515
Поблагодарили: ٢٢٧٨٥
Ай-яй-юшек: 299
Штраф:(10%) X----

Цитата (Макыс @ 27.10.2020 - 16:10:54)

По прежнему говорилка. Конкуренции с живым человеком по прежнему нет.

По описанию здесь речь идет о самообучающейся системе, которая пытается количество перегнать в качество, вроде модная тема. Не уверен вообще, что цель данной работы - улучшение говорилки. )


--------------------
Все мною написанное, если не указано обратное, является моим частным мнением, либо моим частным наблюдением, либо моей частной фантазией, либо моей частной брехней и не в коей мере не претендует на подержаный лейбл со всевозможными надписями типа "общечеловеческие ценности". Просьба учитывать это при прочтении.

Подтверждаю что делегировал, в момент регистрации на Форуме, Админам и Модераторам право на уничтожение любого моего поста на Форуме.
PMПисьмо на e-mail пользователю
Bottom Top
 Алькон Пользователя сейчас нет на форуме
Отправлено: 29.10.2020 - 11:15:22 (post in topic: 4, link to post #885561)
Цитировать сообщение Цитировать выделенный текст


Друг, Товарищ и Брат
****
Профиль
Группа: Members
Сообщений: 1049
Поблагодарили: 1324
Ай-яй-юшек: 23
Штраф:(0%) -----

Цитата (6002011 @ 28.10.2020 - 06:43:20)

По описанию здесь речь идет о самообучающейся системе, которая пытается количество перегнать в качество, вроде модная тема. Не уверен вообще, что цель данной работы - улучшение говорилки.


В конечном итоге цель именно такая - улучшение "говорилки", вернее, всех говорилок.

ИИ как всегда журналисты в статью для красного словца подмешали, но все равно пожелаем этому плохо видящему ученому удачи, сама тема работы практически нужная и полезная - в русском языке омогорафов много, и ошибки в них снижают понимание.

Людьми озвучивается даже не 10 десятая, а в лучшем случае тысячная доля книг художественных, про книги научные и прочие тексты и речи нет - они практически не озвучиваются - что приводит к тому, что люди с ограничениями не могут учиться, работать, следить за научными новостями.

Это сообщение отредактировал Алькон - 29.10.2020 - 11:18:23


--------------------
С наилучшими пожеланиями,
автор и литературный агент
Максим В. Глазунов,
сайт: glazynov.github.io
rutube-канал: rutube.ru/channel/24798542
youtube-канал: youtube.com/channel/UCiGiSKxqUFK5I4EFWj63d3w
PM
Bottom Top
 vicky000000 Пользователя сейчас нет на форуме
Отправлено: 29.10.2020 - 11:47:45 (post in topic: 5, link to post #885562)
Цитировать сообщение Цитировать выделенный текст


Рука раздающего
живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 22172
Поблагодарили: 99662
Ай-яй-юшек: 120
Штраф:(0%) -----

А нет у нас правила один из пары помечать удареним? Как чт\'о vs. что?
PMПисьмо на e-mail пользователюСайт пользователя
Bottom Top
 Koss Пользователя сейчас нет на форуме
Отправлено: 29.10.2020 - 11:57:40 (post in topic: 6, link to post #885563)
Цитировать сообщение Цитировать выделенный текст


GoldPunch keeperЭфир приносящийМастер художественного слова
Подарочек тот ещё...
Group Icon
Профиль
Группа: Global moderators
Сообщений: 23991
Поблагодарили: 77997
Ай-яй-юшек: 61

Техника такого обозначения есть, но правила повсеместного её использования нет. В художественной литературе такого почти не встретишь. В научной и технической литературе вообще, кажется, такого не встречал.

В детских книжках да, попадалось. В словарях и энциклопедиях, конечно, используется.


--------------------
...а в разделе Радио ух ты сколько интересного ещё!
PMПисьмо на e-mail пользователю
Bottom Top
 Алькон Пользователя сейчас нет на форуме
Отправлено: 29.10.2020 - 12:04:05 (post in topic: 7, link to post #885564)
Цитировать сообщение Цитировать выделенный текст


Друг, Товарищ и Брат
****
Профиль
Группа: Members
Сообщений: 1049
Поблагодарили: 1324
Ай-яй-юшек: 23
Штраф:(0%) -----

Нет, как и нет правила писать "ё" вместо "е", что тоже вызывает неверное прочтение.


--------------------
С наилучшими пожеланиями,
автор и литературный агент
Максим В. Глазунов,
сайт: glazynov.github.io
rutube-канал: rutube.ru/channel/24798542
youtube-канал: youtube.com/channel/UCiGiSKxqUFK5I4EFWj63d3w
PM
Bottom Top
 vicky000000 Пользователя сейчас нет на форуме
Отправлено: 29.10.2020 - 12:22:50 (post in topic: 8, link to post #885565)
Цитировать сообщение Цитировать выделенный текст


Рука раздающего
живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 22172
Поблагодарили: 99662
Ай-яй-юшек: 120
Штраф:(0%) -----

Тогда и человек не поймет. E.g., "Я знаю, что ты обо мне думаешь. "
PMПисьмо на e-mail пользователюСайт пользователя
Bottom Top
 6002011 Пользователя сейчас нет на форуме
Отправлено: 29.10.2020 - 12:27:37 (post in topic: 9, link to post #885566)
Цитировать сообщение Цитировать выделенный текст


Убийца смысла


Профиль
Группа: Members
Сообщений: -20515
Поблагодарили: ٢٢٧٨٥
Ай-яй-юшек: 299
Штраф:(10%) X----

Цитата (Koss @ 29.10.2020 - 11:57:40)

В детских книжках да, попадалось. В словарях и энциклопедиях, конечно, используется.

Наверное еще для глухих и плохослышащих есть учебная литература, там тоже должно быть. Ну и тексты, подготовленные для чтения, типа аудиокниг, подозреваю, должны сопровождаться подобной графикой.


--------------------
Все мною написанное, если не указано обратное, является моим частным мнением, либо моим частным наблюдением, либо моей частной фантазией, либо моей частной брехней и не в коей мере не претендует на подержаный лейбл со всевозможными надписями типа "общечеловеческие ценности". Просьба учитывать это при прочтении.

Подтверждаю что делегировал, в момент регистрации на Форуме, Админам и Модераторам право на уничтожение любого моего поста на Форуме.
PMПисьмо на e-mail пользователю
Bottom Top
 Koss Пользователя сейчас нет на форуме
Отправлено: 29.10.2020 - 12:37:31 (post in topic: 10, link to post #885568)
Цитировать сообщение Цитировать выделенный текст


GoldPunch keeperЭфир приносящийМастер художественного слова
Подарочек тот ещё...
Group Icon
Профиль
Группа: Global moderators
Сообщений: 23991
Поблагодарили: 77997
Ай-яй-юшек: 61

ИИ просто не поймёт, а человек не поймёт - может ещё и в глаз дать )


--------------------
...а в разделе Радио ух ты сколько интересного ещё!
PMПисьмо на e-mail пользователю
Bottom Top
 Алькон Пользователя сейчас нет на форуме
Отправлено: 29.10.2020 - 13:02:35 (post in topic: 11, link to post #885569)
Цитировать сообщение Цитировать выделенный текст


Друг, Товарищ и Брат
****
Профиль
Группа: Members
Сообщений: 1049
Поблагодарили: 1324
Ай-яй-юшек: 23
Штраф:(0%) -----

Цитата (6002011 @ 29.10.2020 - 13:27:37)

Наверное еще для глухих и плохослышащих есть учебная литература, там тоже должно быть. Ну и тексты, подготовленные для чтения, типа аудиокниг, подозреваю, должны сопровождаться подобной графикой.


Есть, но цитата выше идет о других текстах.

Цитата (logvin @ 26.10.2020 - 22:23:16)

Сейчас во время учебного процесса школьники и студенты с нарушениями зрения часто сталкиваются с рядом неточностей в автоматической обработке текстов на русском языке.


Цитата (logvin @ 26.10.2020 - 22:23:16)

Ученый опирается на собственный опыт погружения в проблему – вследствие болезни ученый полностью лишился зрения.




--------------------
С наилучшими пожеланиями,
автор и литературный агент
Максим В. Глазунов,
сайт: glazynov.github.io
rutube-канал: rutube.ru/channel/24798542
youtube-канал: youtube.com/channel/UCiGiSKxqUFK5I4EFWj63d3w
PM
Bottom Top



1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:

Опции темы Ответ в темуСоздание новой темыСоздание опроса
 
  


Анклавы Клуба в социальных сетях:
Клуб любителей Аудиокниг - Твиттер  Клуб на ФейсБук  Клуб любителей Аудиокниг - наш канал на YouTube  Канал Клуба Любителей Аудиокниг в Телеграм