{ "author_name": "Дамир Камалетдинов", "author_type": "self", "tags": ["\u0442\u0435\u0445\u043d\u043e\u043b\u043e\u0433\u0438\u0438","google","\u0437\u043e\u043b\u043e\u0442\u043e\u0439\u0444\u043e\u043d\u0434"], "comments": 25, "likes": 45, "favorites": 5, "is_advertisement": false, "section_name": "default", "id": "43919", "is_wide": "" }
Дамир Камалетдинов
34 114

«Это безумие! — Нет, это Google Translate!»: веб-переводчик показывает стихи в ответ на бессмыслицу

Незадолго до этого в Translate внедрили машинное обучение, чтобы улучшить качество переводов.

Поделиться

В избранное

В избранном

Занимавшийся глубоким машинным обучением бывший сотрудник Google Дан Лу (Dan Luu) обнаружил, что если последовательно вводить несколько одинаковых иероглифов на хирагане (прим.ред.— японская письменность), добавляя одни и те же символы с каждой новой строкой, Google-переводчик выдаёт осмысленные фразы и выражения, а иногда и рифмует строки. Результат может быть самым неожиданным, несмотря на довольно просто изначальное значение символов. Об этом Дан Лу сообщил в своём твиттере.

Запись блогера приобрела вирусный эффект, за сутки набрав почти 8 тысячи ретвитов и лайков, и вдохновила других пользователей твиттера на эксперименты. Это вылилось в небольшой флешмоб.

Некоторые из пользователей шутили, что таким образом можно придумать новые способы писать сюжеты для порнофильмов или придумывать слова для популярных песен.

Как оказалось, этот эффект работает и со связкой испанский-английский.

Один из пользователей вдохновился на создание музыкального клипа по мотивам твита Дан Лу. Ролик получил название «Успешная атака».

Однако первоначально необычное поведение переводчика Google заметили на Reddit. В записи от 12 апреля 2017 года пользователь под ником DIA13OLICAL записал видео, на котором продемонстрировал, что если ввести «えぐ» на японском и повторять символы — через раз будут появляться очень забавные результаты.

Чаще всего DIA13OLICAL попадался перевод «DECEARING EGG» («Обжигающее яйцо»). Однако, чем дальше пользователь заходил — тем большая бессмыслица появлялась в переводе.

Комментаторы на YouTube в шутку отметили, что теперь юмор у машин официально лучше, чем у человека и они научились придумывать новые слова.

15 апреля на видео DIA13OLICAL отреагировали в групповом блоге о лингвистике Пеннсильванского университета. 16 апреля автор сайта Марк Либерман (Mark Liberman) обнаружил, что подобный эффект наблюдается и с повторением тайских и корейских символов. Он связал это с тем, что Google использует в Translate особую архитектуру рекуррентных нейронных сетей — LSTM (Долгая краткосрочная память). А одной из особенностей подобных систем является то, что они могут прогнозировать значения на основе введённых до этого символов, но делают это в зависимости от того, на чём они натренированы. В качестве примера Либерман привёл перевод символов «ไๅ», которые он повторил 25 раз, каждый раз добавляя по одной копии знаков в строку. В результате у него получилось стихотворение, похожее на работы американской писательницы Гертруды Стайн.

TJ провёл эксперименты с использованием русских букв и получил такие же неожиданные результаты, как и пользователь Reddit.

Также выяснилось, что баг работает и в обратную сторону: написав несколько раз подряд буквенное сочетание «ash» на английском языке, можно увидеть интересный перевод на русский.

При попытке обнаружить подтасовку переводов через «предложения» (прим.ред — раньше это случалось довольно часто), Google Translate выдал верный ответ.

TJ обратился к российскому представительству Google, но компания не прокомментировала ситуацию.

В конце 2016 года Google начала использовать нейросети в своём переводчике. Тогда пользователи заметили, что качество переводов значительно выросло, а в некоторых случаях дошло до уровня профессионалов. Например, профессор Токийского университета Дзюн Рэкимото (Jun Rekimoto) перевёл один абзац из книги «Снега Килиманджаро» самостоятельно на японский, а затем с помощью Google Translate обратно на английский. После этого он опубликовал в твиттере два варианта — англоязычный оригинал и свою интерпретацию, переведённую Google, и предложил cвоим подписчикам в Твиттере отгадать, что было оригиналом. Большинство пользователей приняло за «официальный» вариант Рэкимото.

#технологии #google #золотойфонд

Популярные материалы
Показать еще
{ "is_needs_advanced_access": true }

Популярные комментарии

Дискуссии по теме
доступны только владельцам клубного аккаунта

Купить за 75₽
Авторизоваться

Преимущества
клубного аккаунта

  • отсутствие рекламы
  • возможность писать комментарии и статьи
  • общение с членами клуба
Подробнее

Преимущества
клубного аккаунта

  • отсутствие рекламы
  • возможность читать и писать комментарии
  • общение с членами клуба
  • возможность создавать записи

Сколько это стоит?

Членство в клубе стоит всего 75₽ в месяц. Или даже дешевле при оплате за год.

Что такое клуб?

Клуб ТЖ это сообщество единомышленников. Мы любим читать новости, любим писать статьи, любим общаться друг с другом.

Вступить в клуб

Комментарии Комм.

Популярные

По порядку

0

Прямой эфир

Вы не против подписаться на важные новости от TJ?

Нет, не против
[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "i", "ps": "cndo", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "i", "ps": "cndo", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfk" } } }, { "id": 6, "disable": true, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "clmf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byswn", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "create", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "cndo", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223677-0", "render_to": "inpage_VI-223677-0-101273134", "adfox_url": "//ads.adfox.ru/228129/getCode?p1=byaeu&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid11=&puid12=&puid13=&puid14=&puid21=&puid22=&puid31=&fmt=1&pr=" } }, { "id": 15, "label": "Плашка на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudv", "p2": "ftjf" } } } ]