Ответ в темуСоздание новой темыСоздание опроса

> Поэзия ошибок «Google Переводчика», Искусственный интеллект или искусственное безумие?
 logvin Пользователя сейчас нет на форуме
Отправлено: 26.12.2018 - 13:38:26 (post in topic: 1, link to post #836750)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Moderators
Сообщений: 9044
Поблагодарили: 30427
Ай-яй-юшек: 11
Штраф:(0%) -----

Уже больше года молодой писатель и SMM-щик Роман Трунин вводит в сервис «Google Переводчика» бессвязные наборы символов, вроде «эээ эээ ааа ээээа», а на выходе получает глубокие поэтические образы вроде «Сердцебиение всадника — самая дальняя точка лошади» или «Звук волн — это тень ветра». Никто точно не знает, как это происходит, Google комментариев не дает — строчки генерируются буквально из ниоткуда. Трунин вместе с энтузиастами стал коллекционировать смешные и интересные артефакты в проекте Neural Machine — часто они пропитаны мистикой и смертью, иногда — извращениями и пророчествами об Израиле. Некоторые строчки объединяют в поэмы или даже визуализируют с помощью других нейросетей. В Twitter на проект уже подписаны 33 тысячи человек, среди которых — Алексей Навальный и певица Елка. The Village выяснил у Трунина, как рождается glitch-poetry искусственного интеллекта и в чем вообще подвох.

user posted image

Сейчас автор проекта заявляет, что начал российский тренд не он: кто-то выложил в ленту скриншот, где сервис Google перевел «ааааааааааааааааа» с монгольского на русский как «все в порядке». Роман Трунин же решил развить метод, и следующим экспериментом стало повторение на монгольском буквы «Э»: каждая добавляемая буква кардинально меняла результат, приходя в итоге к пугающему «монстр монстр монстр монстр» — что само по себе выглядело как перформанс.

user posted image

Трунин стал пробовать вбивать разные бессвязные хаотические наборы символов на других языках — и у многих находилась своя специфика, если баг срабатывал: «Монгольский оказался очень сумеречный, с воинственно-племенной риторикой. Люксембургский застревает на фетишизации львов, орлов, сундуков, скал, местами очень похоже на библейские пророчества про зверя, выходящего из моря. Монгольский лучше всего реагирует на гласные, а таджикский и люксембургский совершенно всеядные».

user posted image

Запустив проект в соцсетях, Трунин позвал других пользователей точно также перебирать запросы в переводчик и публиковать их в группу. Оказалось, что самыми популярными становятся простые фразы, с которыми люди могут себя ассоциировать: «Они видят, что коллективное бессознательное нейросети так же страдает, так же терзается внутренними демонами. Я проверяю всю выдачу на реальные цитаты (то есть можно ли в интернете найти исходник перевода. — Прим. ред.) и никогда не нахожу стопроцентного совпадения. Я просто ввожу случайные комбинации букв и слежу за результатами. Если вижу какую-то интересную тему, начинаю бережнее модулировать [сочетания символов]».

Трунин занимается литературой, поэтому он стал извлекать из «Google Переводчика» точно таким же методом не просто мемы, но и целые моностихи: «Они похожи на грегерии (или хокку. — Прим. ред.) по жанровой природе, только еще более неочевидные. Среди моих самых любимых моностихов нейромашины есть, например, такие:

user posted image

Создавать более сложные и длинные «поэмы» предложил digital-художник Сергей Егоров. Он написал несколько скриптов и автоматизировал процесс перебора сочетаний букв, которые давали осмысленный результат от «Google Переводчика», а затем собирал строчки по тематическим категориям. Уже после вручную из этих строчек собирались «поэмы», которые вновь «прогонялись» через переводчик. Трунин считает, что избежать ручного вмешательства на данный момент баг Google не позволяет. Всего в альбоме Егорова сейчас чуть больше 20 «поэм».

user posted image

«Я бы не искал в этом какой-то мистики, хотя я не знаю, в каких религиозных книгах есть фразы вроде «я убью тебя» или «я трахаю мальчика десяти лет», очень мрачные вещи возникают порой, — объясняет Роман Трунин. — Темы конца света или что-то сатанинское я уже даже не фиксирую, там этого слишком много. С другой стороны, попадается много и просто разговорных бытовых фраз вроде «пойдем спать», там и признания в любви, иногда порно-описания и даже просто названия интерфейса, кнопок типа «вход регистрация вы здесь главная», ссылки, адреса электронной почты («Google Переводчик» действительно иногда выдает неизвестные контактные данные в ответ на обычные бессвязные словосочетания; особым мемом в сообществе Neural Machine даже стал адрес «Ижевск, ул. Ленина, 18». — Прим. ред.).


Как попробовать самому?

Откройте приложение Google Translate на телефоне или зайдите на стандартный сайт
Код
Доступно только для зарегистрированных пользователей


Выберите необычный язык ввода, например монгольский (еще можно таджикский, кхмерский, люксембургский и другие), и язык перевода — русский.

Наберите во вводе несколько раз одну гласную, например «о», или согласную, например «ч», иногда беспорядочно разделяя ее пробелом.

После четвертого или пятого такого сочетания с пробелами в результате перевода появится хаотическая фраза. В нашем случае по «ООО ООО ОО ООО ООО ООООО» выдало: «У ВАС ЕСТЬ КОКОСОВОЕ МОЛОКО?», а по «ЧЧЧ ЧЧ ЧЧЧЧ ЧЧ Ч Ч ЧЧЧЧЧЧ Ч Ч ЧЧ»: «ДАЖЕ ЕСЛИ ВЫ ВАССИСТ, ВЫ ВСЕ РАВНО МОЖЕТЕ БЫТЬ АВАНГАРДОМ».

Продолжайте экспериментировать с разными гласными, сочетаниями символов, пробелов — и наслаждайтесь.


Почему так происходит?

Причина, конечно, в нейросетях, которые внедряют повсюду уже пять лет. С марта 2017 года «Google Переводчик» тоже использует в своей работе сложный механизм «рекуррентных нейронных сетей»: на практике это значит, что переводчик смотрит не только на отдельное слово, но и на фразу, предложение или даже весь абзац, количество символов — то есть учитывает «контекст» и еще множество других, известных только ему, параметров, прежде чем выдать вариант перевода.

Сами разработчики сервиса официально никогда не комментировали артефакты, которые появляются при вводе бессмысленных наборов букв (из российских медиа без ответа остались запросы The Village и TJournal). Но в марте 2017 года глава команды «Google Переводчика» Барак Туровски объяснял «Медузе», что из-за сложности устройства нейросети причину возникновения той или иной ошибки перевода не всегда вообще можно отследить — механизм больше похож на самообучающийся «черный ящик». Тем не менее для «обучения» нужен массив данных для тренировки (об этом свойстве нейросетей мы рассказывали в гиде по распознаванию лиц). У текстовой информации такие массивы называют «корпусами текстов». Для сбора корпусов на «редких» языках вроде казахского Google с 2014 года использует помощь добровольцев — Google Translate Community. Возможно, именно этим объясняется странный и «драматичный» интуитивный перевод с «монгольского» или «таджикского» — просто именно такие тексты добровольцы могли загружать для аналитики.

Издание TJournal отследило, как параллельно слава об этом артефакте переводчика распространялась и на западных имиджбордах: загадочные результаты появлялись при переводе на английский, например, тайских и корейских символов. Лингвист Марк Либерман также связал это с особенностью архитектуры рекуррентных нейронных сетей — в качестве примера он привел перевод символов «ไๅ», которые повторил 25 раз, каждый раз добавляя по одной копии знаков в строку. В результате у него получилось стихотворение, похожее на работы американской поэтессы Гертруды Стайн.

Бывший инженер Google по машинному обучению Дмитрий Гензель в 2017 году высказал мнение о баге на портале Quora. Тогда пользователи удивлялись, почему, если вводить в переводчик многократно повторенное «pe pe pe», он «выдает странные вещи про Израиль».

Дмитрий Гензель
research scientist at Google (2005–2016)

Цитата
«...Грубо говоря, он [механизм нейросети] берет фразу на одном языке и помещает ее в какое-то „множество понятий“, а затем пытается подобрать близкие к этому множеству понятия на другом языке.

Но что происходит, если вы вставляете в переводчик белиберду? Он все так же пытается ее куда-то поместить, только теперь это множество понятий случайное. И когда переводчик ищет подходящее к этому „случайному“, вы можете получить что угодно. Ведь сервис изначально предполагает, что введенные вами данные должны иметь хоть какой-то смысл, поэтому он и продолжает искать его дальше и перебирает все возможные варианты. Он не хочет отдавать вам обратно белиберду, поэтому стремится выдать хотя бы просто законченное предложение».


«Искусственное безумие»

Пользователи соцсетей часто тревожно реагируют на проявления бага — он кажется им свидетельством уже существующего искусственного интеллекта. Трунин считает иначе: «По-моему, Google перешагнул и создал искусственное безумие. Ведь это психическое расстройство, когда ты на основе вторичных данных получаешь несуществующие образы, а затем неосознанно достраиваешь информацию, получая искаженный результат. „Google Переводчик“ оказывается также склонным к шизофазии и неологизмам, он также видит в случайных буквах что-то отдаленно напоминающее ему знакомые данные. Это аналог человеческого явления „парейдолии“ — когда видишь рожицы в текстуре обоев на стене или сфинкса на Марсе. Мы увидели, каковы будут галлюцинации роботов».

Трунин уже выпустил повесть «Маяк» и цикл «генеративной поэзии» из комбинированных текстов. В будущем он планирует сделать полноценный сборник стихов в соавторстве с «Google Переводчиком». В какой-то момент он пошел еще дальше в экспериментах с «вторичностью» и решил действительно визуализировать фантазии нейросети с помощью другой нейросети — AttnGAN и сервиса Text-to-Image нью-йоркского программиста Кристобаля Валенсуэлы. База фотографий довольно маленькая, поэтому все изображения вышли в похожей цветовой гамме, но образы, сгенерированные одной нейромашиной («Google Переводчиком») b воссозданые другая нейромашиной (AttnGAN), все равно получаются интуитивно понятны.

О том, что «баг» могут в какой-то момент закрыть, Трунин не переживает: «Скорей бы, я тогда буду свободен! Там ведь много мусора, на 100–200 результатов перебором получается, может, один, который я запощу в твиттере. Иногда уходишь ни с чем спустя час-два лингвистического майнинга, как я это в шутку называю. Я очень разборчив. На самом деле, я убежден, что всегда смогу найти лазейку. Это ведь не какая-то ошибка: Google получил именно то, что и хотел, переводчик с нейросетью стал работать лучше. А когда-то искали лекарство для сердца — и создали виагру».

Код
Доступно только для зарегистрированных пользователей


 


--------------------
Если Вы зарегистрированы на нашем форуме, то Вы читали Правила Форума и обязались их исполнять!

Если Вы их не исполняете - то не обижайтесь на действия модератора!
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Lona, Koss, Элья, Поручик, vicky000000, Vasab
 Lona Пользователя сейчас нет на форуме
Отправлено: 26.12.2018 - 14:16:57 (post in topic: 2, link to post #836751)
Цитировать сообщение Цитировать выделенный текст


Persuasion MasterGold
не Подарок
Group Icon
Профиль
Группа: Global moderators
Сообщений: 30119
Поблагодарили: 115155
Ай-яй-юшек: 123

Прикольно! Первое, что получила, выговор от Гугла ges_slap

user posted image

добавила несколько g, результат улучшился:
так же хорошо, как и самый крутой
так же хорошо, как хорошо, как мелодичный


потом гугл стал заговариваться:
так хорошо, как хорошо, как может быть так же хорошо, как много

так хорошо, как пирог, так хорошо, как звякнуть, как вы можете

так же хорошо, как и странно настолько быстро, насколько это возможно


и наконец, перешёл на личности:
жадный
легкомысленный
сожрал
общительный
таракан


За таракана обиделась было, но гугл тут же выдал:
как насчет тебя?
Ты лучший для тебя.


заставил задуматься:
Вы можете использовать его бесплатно.

перешёл к новостям о каннибализме:
хорошие новости о
поглощение изможденного


Завершил перевод по-мефистофелевски:
хахахахахахахаха хахаха

Плоховато у него с индонезийским! drag

а если применять побелы, то более осмысленные фразы:
Гугл о себе::
и не хороший, хороший, хороший, хороший, хороший, хороший, хороший, хороший, качественный сервис.

пробило на искренность:
Мне нравится говорить, что вам не нужно.

а вежливый-то какой! handup
Прощай, лучший в мире.

А напоследок он сказал:
user posted image
faxenmach

а когда я не отстала, припечатал:
Что бы вы ни делали, игра не очень хорошая. nono


--------------------
"Это было навсегда, пока не кончилось"
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Koss, logvin, Элья, Поручик, Mozly, vicky000000, trya
 dansheri Пользователя сейчас нет на форуме
Отправлено: 26.12.2018 - 14:50:22 (post in topic: 3, link to post #836754)
Цитировать сообщение Цитировать выделенный текст


Проверенный Товарищ
**
Профиль
Группа: Members
Сообщений: 438
Поблагодарили: 559
Ай-яй-юшек: 63
Штраф:(0%) -----

На языке хмонг, поэтапное внесение магического слова "абырвалг" не привносит ничего нового в процесс стерео-звукозаписи, но оканчивается всё нетривиально фразой: "неопытный и неосведомленный неопытный и недоступный неопытный связывающий профит читатель читатель читатель хлеб"


--------------------
Путин не Родина. РПЦ не Бог. Воровство не национальная идея. Толпа баранов не соотечественники. Нефть не экономика. Москва не вся Россия.
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: logvin, Lona, Элья
 AliBaba Пользователя сейчас нет на форуме
Отправлено: 26.12.2018 - 18:42:49 (post in topic: 4, link to post #836771)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 5817
Поблагодарили: 10683
Ай-яй-юшек: 83
Штраф:(0%) -----

Народ, я что-то абсолютно не врубаюсь help
Пытаюсь делать то же, что и вы и ничего не получается. абырвалг с хмона так и остается абырвалг-ом. Буквы ggggg ggg ggg и пр. на индонезийском и таджикском не меняются при переводе на русский ... help
PMПисьмо на e-mail пользователю
Bottom Top
 Lona Пользователя сейчас нет на форуме
Отправлено: 26.12.2018 - 19:02:03 (post in topic: 5, link to post #836774)
Цитировать сообщение Цитировать выделенный текст


Persuasion MasterGold
не Подарок
Group Icon
Профиль
Группа: Global moderators
Сообщений: 30119
Поблагодарили: 115155
Ай-яй-юшек: 123

Цитата (AliBaba @ 26.12.2018 - 19:42:49)
абырвалг с хмона так и остается абырвалг-ом

ты просто не умеешь его готовить:

user posted image

Может у гугла инд. подход?
Но вообще-то получается далеко не со всеми буквами. Мне случайно повезло буквально со второй попытки, а потом пробовала - или ничего, или не интересно, нет фраз dunno

ещё абырвалги:

абырвалгабырвалгабырвалгабырвалг абырвалг абырвалг абырвалг абырвалг = трудно поверить, что это длинная история

абырвалгабырвалгабырвалгабырвалг абырвалг абырвалг абырвалг = Это дерьмовая история

Дальше при удалении одной буквы с конца, каждый раз получаются разные фразы. (Это давно. Трудно представить. В это трудно поверить. Это потрясающий стерео. Это сильный ветер. и т.д.)
Может это специально для россиян? )

При размножении абырвалгов с интервалами, у гугла едет крыша:
Трудно поверить, что болезненное отверстие может вызвать раздражение
Трудно быть в состоянии управлять рулем руля.
бриз устал от болезненного затяжного удара в живот легкого
Трудно поверить, что это долгий путь, но это не значит, что это будет тяжело.
победитель шарика ставит мяч и мяч в мяч и мяч в мяч и мяч в мяч
sdvig


--------------------
"Это было навсегда, пока не кончилось"
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: logvin, AliBaba, Mozly, Элья
 AliBaba Пользователя сейчас нет на форуме
Отправлено: 26.12.2018 - 19:23:24 (post in topic: 6, link to post #836779)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 5817
Поблагодарили: 10683
Ай-яй-юшек: 83
Штраф:(0%) -----

Цитата (Lona @ 26.12.2018 - 16:02:03)
ты просто не умеешь его готовить:

Ваауу! Скопипастил и получилось clap
Добавлено:
Цитата (Lona @ 26.12.2018 - 16:02:03)
Но вообще-то получается далеко не со всеми буквами.

И не со всеми языками: абырвалги в переводе с индонезийского и киргизского (гугл посоветовал) таки остаюся абырвалгами. Хмоны рулят!
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Lona, Mozly, Элья
 Mozly Пользователя сейчас нет на форуме
Отправлено: 26.12.2018 - 21:14:18 (post in topic: 7, link to post #836798)
Цитировать сообщение Цитировать выделенный текст


ФлудерЗаслуженый АбуканецGoldКоролевешна
16 лет в Клубе!
Group Icon
Профиль
Группа: Privileged
Сообщений: 39427
Поблагодарили: 87529
Ай-яй-юшек: Ниразу :)
Штраф:(0%) -----

Цитата (AliBaba @ 26.12.2018 - 19:42:49)
абырвалг с хмона

Если абырвалг - главрыба... А что это за язык такой - хмон? Где на нём говорят? )
PM
Bottom Top
 AliBaba Пользователя сейчас нет на форуме
Отправлено: 27.12.2018 - 03:05:29 (post in topic: 8, link to post #836819)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 5817
Поблагодарили: 10683
Ай-яй-юшек: 83
Штраф:(0%) -----

Цитата (Mozly @ 26.12.2018 - 18:14:18)
А что это за язык такой - хмон? Где на нём говорят?

В горах между Вьетнамом и Лаосом. В Китае их назыывают Мяо. В Штатах в новостях, что я видел, всплывали несколько раз в криминальной хронике.
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Элья, Mozly, Lona



0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:

Опции темы Ответ в темуСоздание новой темыСоздание опроса
 
  


Анклавы Клуба в социальных сетях:
Клуб любителей Аудиокниг - Твиттер  Клуб на ФейсБук  Клуб любителей Аудиокниг - наш канал на YouTube  Канал Клуба Любителей Аудиокниг в Телеграм