Рубрика развивается при поддержке
Advertisement

В переводчике Google нашли основанный на латыни тайный шифр Статьи редакции

Сотрудники компании FireEye обнаружили в переводчике Google тайный шифр, основанный на латинской фразе «Lorem Ipsum», использующейся в интернете в качестве бессмысленного текста для заполнения пустого места на макетах веб-страниц. Об этом в своём блоге 18 августа сообщил специалист по кибербезопасности Брайан Кребс.

Шифр удалось обнаружить исследователю FireEye Майклу Шукри (Michael Shoukry) и его помощнице, не называющей своего реального имени и пользующейся в сети никнеймом Kraeh3n.

Секретный «язык» оказался встроен в сервис Google Translate. При вводе в поле перевода латинского словосочетания «lorem ipsum», написанного с двух строчных букв, сервис сообщал, что по-английски оно означает «Китай». Обратный порядок слов — «ipsum lorem» — переводился как «интернет». Те же слова, но написанные с заглавных букв — «Lorem Ipsum» — выдавали аббревиатуру Организации Североатлантического альянса, НАТО (NATO).

Ввод в Google Translate ещё нескольких версий написания фразы позволял обнаружить и другие засекреченные слова. Большая их часть была так или иначе связана со всемирной сетью и Китаем.

Дублируя фразу один или два раза в различном написании и с разным порядком слов, Шукри и Kraeh3n удалось составить таблицу таких странных переводов, складывавшихся уже не в отдельные слова, а в целые предложения. В большинстве своём предложения не имели смысла и были не закончены — «Пожалуйста, проверьте, что автомобиль», «Запуск в Китае и китайский», «Запуск Китая и интернет», «Это повредило маркетинговой технологии», «О самой игре», «Китайский интернет-феномен», «Интернет-технологии в Китае», «Спасибо за интернет» и так далее.

Дальнейшие исследования показали, что в качестве шифра использовались не только первые два слова из текста шаблонной фразы, а вся фраза целиком, в полной версии выглядящая вот так.

Перевод разных отрывков текста выдавал порой самые удивительные результаты — от фраз о том, что «Россия возможно будет страдать», до предложений вроде «Китай — это боль» и «Возможно, это и есть интернет».

Мы подумали, что, возможно, Google просто ошибается в переводе. Но то, что слова получают такие значения — Китай, НАТО, свободный интернет — заставило задуматься. Просто баг? Или шифр внедрён в переводчик намеренно? Неужели с его помощью кто-то может общаться? Что это на самом деле? Майкл Шукри, сотрудник компании FireEye

Как пишет Брайн Кребс, узнавший об открытии странного шифра в Google Translate от одного из своих знакомых, исследователям удалось протестировать «баг» в переводчике всего несколько недель. Начиная с 16 августа слова «Lorem Ipsum», в каком бы виде они ни были написаны, стали выдавать только один вариант перевода — «Lorem Ipsum».

Представитель Google рассказал Кребсу, что интернет-компания обнаружила неисправность в алгоритме переводчика и устранила её. Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев.

Существующий сегодня алгоритм перевода Google Translate был внедрён американской интернет-компанией в 2007 году. Система основывается на постоянном самообучении, улучшая собственные способности за счёт анализа текстов, переведённых с одного языка на другой живыми людьми. Часть языковых пар переводится Google напрямую, другие — через промежуточный перевод на английский язык.

Фраза-шаблон, начинающаяся со слова «Lorem Ipsum», представляет собой искажённый отрывок из трактата древнеримского философа и государственного деятеля Цицерона «О пределах добра и зла». Трактат был написан в 45 году до нашей эры.

Версия фразы, использующаяся дизайнерами при заполнении макетов страниц, не имеет перевода. Оригинальный же кусок, из которого сделан шаблон, выглядит так: «Neque porro quisquam est, qui dolorem ipsum, quia dolor sit, amet, consectetur, adipisci velit» (перевод: «нет никого, кто возлюбил бы, предпочел и возжаждал бы само страдание только за то, что это страдание»).

0
72 комментария
Популярные
По порядку
Написать комментарий...
Парадный каякер

Не, ну тут все понятно. Заговор раскрыт - теперь можно и спать идти

60

Комментарий удален

Комментарий удален

Парадный каякер

"Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев."

57
Парадный каякер
52
Парадный каякер
52
Парадный каякер
14
Парадный каякер
2
Парадный каякер
1
Парадный каякер

Пам ПАМ ПАААААААМ

0
Парадный каякер
43
Парадный каякер

Я уже купил билет в Китай

0
Парадный каякер

мурашки по коже пошли

26
Парадный каякер

Они и не исправили это, кстати

20
Парадный каякер

значит, страдания неизбежны

12
Парадный каякер

Если написать Consectetur именно с большой буквы, то вместо России будет Minneapolis

7
Парадный каякер

Для особых ценителей тайных шифров

13
Парадный каякер

Предвкушаю заголовки пророссийских СМИ "Гугл сказал, что Россия будет страдать", "Переводчик гугла тайно контролируется госдепом США".

12
Парадный каякер

дык, все всё давно поняли про гугл) а какой хороший был ютуб, до того, как они его купили.

11
Парадный каякер
10
Парадный каякер

А тем временем где-то в китайском, например, МИДе или там ЦК Компартии Китая перестала обновляться одна страничка, на которой уже несколько лет висела слегка измененная заглушка "Ipsum ipsum lorem sit...".

10
Парадный каякер
9
Парадный каякер

Один из принципов обучения перевода: скан множества документов из открытых источников, которые заведомо верно переведены на несколько языков. Это всякие там директивы ООН и т.д. Судя по всему эти документы закончились и в список попали источники с некачественным переводом, в которых в каких-то фрагментах оставляли лорем ипсум. В результате алгоритм накопил достаточно ассоциаций, чтобы заставить вас ложить кирпичи.

9
Парадный каякер

Разве алгоритм учитывает с какой буквы пишется слово, с прописной или строчной?

0
Парадный каякер

Да. Я это замечал и на других примерах. О причинах нам поведать больше смогут лингвисты, но думаю, что речь идет о распознавании аббревиатур, об определении имен собственных и их части в предложени и т.д. На результат влияет даже точка в конце предложения.

5
Парадный каякер

Ясно, спасибо.

0
Парадный каякер

Конечно учитывает, весь перевод по сути держится на машинном обучении, включая пунктуацию.

0
Парадный каякер

Самое логичное объяснение.

0
Парадный каякер

"алгоритм накопил достаточно ассоциаций, чтобы заставить вас ложить кирпичи"
Надо такие алгоритмы отдельно распространнять - годная крипота

0
Парадный каякер

Прикрепляйте, пожалуйста, под такими статьями музыку из «Секретных Материалов». А то явно чего-то не хватает.

8
Парадный каякер

раньше помнится можно было добавлять свои варианты перевода, и на этом основывалось огромное количество шуток.
например

6
Парадный каякер

Ятаки не понял дизайн этой text area

0
Парадный каякер
6
Парадный каякер
5
Парадный каякер

БЕЗНОГNМ!

1
Парадный каякер
1
Парадный каякер
5
Парадный каякер

Ехал Ipsum через Ipsum
Видит Ipsum в реке Ipsum
Сунул Ipsum в реку Ipsum
Ipsum Ipsum Ipsum Ipsum

4
Парадный каякер

А еще можно так:
Lorem Ipsum lorem lpsum
lorem Ipsum Lorem lpsum
lorem ipsum lorem lpsum
Ipsum ipsum Ipsum Ipsum

1
Парадный каякер

Вау, у вас большая I и маленькая l неотличимые

0
Парадный каякер

У вас получилось:
Lorem ipsum lorem lpsum
lorem ipsum lorem lpsum
lorem ipsum lorem lpsum
Very very very very

0
Парадный каякер

Ехал ipsum через ipsum
Видит ipsum в lorem ipsum
ipsum ipsum ipsum ipsum
lorem ipsum lore ipsum!

3
Парадный каякер

Надеюсь Шукри еще жив.

3
Парадный каякер

Спасибо за интернет.

2
Парадный каякер

Тот неловкий момент, когда не успеваешь допечатать последнюю букву, а Гугл уже выдаёт перевод...

2
Парадный каякер

valar morghulis

2
Парадный каякер

Если в Word'е ввести конструкцию вида =lorem(a,b), где a — количество абзацев, а b — количество предложений в каждом абзаце, и нажать enter, то на странице в заданном формате сгенерируется что бы вы думали? Lorem ipsum! Формула =lorem(3,10) даст результат в 3 абзаца по 10 предложений в каждом, а =lorem(10,3) — соответственно, наоборот.

2
Парадный каякер

Так и развивается...

2
Парадный каякер

Проделки ZOG

1
Парадный каякер

Google Переводчик - статистический. Собственно, этим всё и объясняется.

1
Парадный каякер

Казалось бы, причём здесь ЦРУ? =))

1
Парадный каякер

Синим полотнищем — фаза вершины. Я призываю дух из машины.

1
Парадный каякер

Подозреваю, что на подобных фразах разработчики что-нибудь тестировали, а потом попросту забыли убрать

1
Парадный каякер

Exactly my point.

0
Парадный каякер

./// которая поможет вам принять мою Правду

1) НЕ ПЫТАЙТЕСБ ЧТОТ0 И3МЕНИТЬ!

2) ДУМАNТ3 ТОЛЬКО О СЕБЕ!

3) РУКИ

4) ДОСМОТ?

людей посмотревших сойдут с ума

БЕЗНОГИМ

Получилось? В этом видео звук соджержит слепок V1 o5 u2 наложение — ШИМ

В нем нету ничего злого, но оно пугает. Но после просмотра вы почувствуете радость, и в дальнейшем всё в вашей жизни будет хорошо!

Ваш друг.

1
Парадный каякер

Кто с хабра - тот поймет

0
Парадный каякер

А вот простая фраза "Ла-ла-ла-ла ла-ла-ла-ла",
хотя и кажется бессмысленной, способна рассказать очень многое о текущей геополитической ситуации без всякого перевода.
Удивительно, правда?

–8
Парадный каякер

Вспоминается truecrypt и "If I wish to use the NSA"

0
Парадный каякер

Масоны, они повсюду)

0

Комментарий удален

Комментарий удален

Комментарий удален

Парадный каякер

Все нормально, это просто AI гугл переводчика обучается и готовится захватить интернет.

0
Парадный каякер

Это все жидомассоны

0
Парадный каякер

До сих пор же хрень выдает

0
Парадный каякер

Вот это самое страшное

20
Парадный каякер
3
Парадный каякер

Ну там-же машинное обучение. Не разбираюсь в этом, но мне кажется мог кто-то просто пошутить, дав выборку текстов про интернет/Россию/Китай и как их перевод дать Lorem Ipsum. вот и весь заговор.

0
Парадный каякер

Это переводчик был обучаем. Можно было собственные переводы добавлять. Вот кто-то и прикололся

0
Парадный каякер
0
Парадный каякер

теперь все понятно

0
Парадный каякер
0
Парадный каякер
0
Парадный каякер

la-li-lu-le-lo

0
Парадный каякер

Алгоритм перевода статистический, и основывается он на параллельных текстах, которые они черпают в том числе и из индексируемых страниц и документов в интернете.

Поскольку часто там, где нет подходящего контента на другом языке, разработчики сайтов лепят "Lorem ipsum dolor sit amet...", то не исключено, что оно попадает в паблик, а затем и в поисковый индекс, и оттуда уже в переводы.

Более подробно - http://borches.livejournal.com/1378263.html

0
Парадный каякер

:(. Но спасибо, да.

0
Читать все 72 комментария
null