Технологии
Виктор Степанов

В переводчике Google нашли основанный на латыни тайный шифр

Сотрудники компании FireEye обнаружили в переводчике Google тайный шифр, основанный на латинской фразе «Lorem Ipsum», использующейся в интернете в качестве бессмысленного текста для заполнения пустого места на макетах веб-страниц. Об этом в своём блоге 18 августа сообщил специалист по кибербезопасности Брайан Кребс.

Шифр удалось обнаружить исследователю FireEye Майклу Шукри (Michael Shoukry) и его помощнице, не называющей своего реального имени и пользующейся в сети никнеймом Kraeh3n.

Секретный «язык» оказался встроен в сервис Google Translate. При вводе в поле перевода латинского словосочетания «lorem ipsum», написанного с двух строчных букв, сервис сообщал, что по-английски оно означает «Китай». Обратный порядок слов — «ipsum lorem» — переводился как «интернет». Те же слова, но написанные с заглавных букв — «Lorem Ipsum» — выдавали аббревиатуру Организации Североатлантического альянса, НАТО (NATO).

Ввод в Google Translate ещё нескольких версий написания фразы позволял обнаружить и другие засекреченные слова. Большая их часть была так или иначе связана со всемирной сетью и Китаем.

Дублируя фразу один или два раза в различном написании и с разным порядком слов, Шукри и Kraeh3n удалось составить таблицу таких странных переводов, складывавшихся уже не в отдельные слова, а в целые предложения. В большинстве своём предложения не имели смысла и были не закончены — «Пожалуйста, проверьте, что автомобиль», «Запуск в Китае и китайский», «Запуск Китая и интернет», «Это повредило маркетинговой технологии», «О самой игре», «Китайский интернет-феномен», «Интернет-технологии в Китае», «Спасибо за интернет» и так далее.

Дальнейшие исследования показали, что в качестве шифра использовались не только первые два слова из текста шаблонной фразы, а вся фраза целиком, в полной версии выглядящая вот так.

Перевод разных отрывков текста выдавал порой самые удивительные результаты — от фраз о том, что «Россия возможно будет страдать», до предложений вроде «Китай — это боль» и «Возможно, это и есть интернет».

Мы подумали, что, возможно, Google просто ошибается в переводе. Но то, что слова получают такие значения — Китай, НАТО, свободный интернет — заставило задуматься. Просто баг? Или шифр внедрён в переводчик намеренно? Неужели с его помощью кто-то может общаться? Что это на самом деле? Майкл Шукри, сотрудник компании FireEye

Как пишет Брайн Кребс, узнавший об открытии странного шифра в Google Translate от одного из своих знакомых, исследователям удалось протестировать «баг» в переводчике всего несколько недель. Начиная с 16 августа слова «Lorem Ipsum», в каком бы виде они ни были написаны, стали выдавать только один вариант перевода — «Lorem Ipsum».

Представитель Google рассказал Кребсу, что интернет-компания обнаружила неисправность в алгоритме переводчика и устранила её. Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев.

Существующий сегодня алгоритм перевода Google Translate был внедрён американской интернет-компанией в 2007 году. Система основывается на постоянном самообучении, улучшая собственные способности за счёт анализа текстов, переведённых с одного языка на другой живыми людьми. Часть языковых пар переводится Google напрямую, другие — через промежуточный перевод на английский язык.

Фраза-шаблон, начинающаяся со слова «Lorem Ipsum», представляет собой искажённый отрывок из трактата древнеримского философа и государственного деятеля Цицерона «О пределах добра и зла». Трактат был написан в 45 году до нашей эры.

Версия фразы, использующаяся дизайнерами при заполнении макетов страниц, не имеет перевода. Оригинальный же кусок, из которого сделан шаблон, выглядит так: «Neque porro quisquam est, qui dolorem ipsum, quia dolor sit, amet, consectetur, adipisci velit» (перевод: «нет никого, кто возлюбил бы, предпочел и возжаждал бы само страдание только за то, что это страдание»).

#Google #Китай #спецслужбы #криптография #Брайан_Кребс #тайные_языки #тайный_язык_в_Google_Translate #в_переводчике_Google_нашли_секретный_шифр #шифры #шифры_в_интернете #Lorem_Ipsum #латинский_язык #шифр_на_латыни #вымершие_языки #НАТО #шпионы