Рубрика развивается при поддержке
Advertisement

В переводчике Google нашли основанный на латыни тайный шифр Статьи редакции

Сотрудники компании FireEye обнаружили в переводчике Google тайный шифр, основанный на латинской фразе «Lorem Ipsum», использующейся в интернете в качестве бессмысленного текста для заполнения пустого места на макетах веб-страниц. Об этом в своём блоге 18 августа сообщил специалист по кибербезопасности Брайан Кребс.

Шифр удалось обнаружить исследователю FireEye Майклу Шукри (Michael Shoukry) и его помощнице, не называющей своего реального имени и пользующейся в сети никнеймом Kraeh3n.

Секретный «язык» оказался встроен в сервис Google Translate. При вводе в поле перевода латинского словосочетания «lorem ipsum», написанного с двух строчных букв, сервис сообщал, что по-английски оно означает «Китай». Обратный порядок слов — «ipsum lorem» — переводился как «интернет». Те же слова, но написанные с заглавных букв — «Lorem Ipsum» — выдавали аббревиатуру Организации Североатлантического альянса, НАТО (NATO).

Ввод в Google Translate ещё нескольких версий написания фразы позволял обнаружить и другие засекреченные слова. Большая их часть была так или иначе связана со всемирной сетью и Китаем.

Дублируя фразу один или два раза в различном написании и с разным порядком слов, Шукри и Kraeh3n удалось составить таблицу таких странных переводов, складывавшихся уже не в отдельные слова, а в целые предложения. В большинстве своём предложения не имели смысла и были не закончены — «Пожалуйста, проверьте, что автомобиль», «Запуск в Китае и китайский», «Запуск Китая и интернет», «Это повредило маркетинговой технологии», «О самой игре», «Китайский интернет-феномен», «Интернет-технологии в Китае», «Спасибо за интернет» и так далее.

Дальнейшие исследования показали, что в качестве шифра использовались не только первые два слова из текста шаблонной фразы, а вся фраза целиком, в полной версии выглядящая вот так.

Перевод разных отрывков текста выдавал порой самые удивительные результаты — от фраз о том, что «Россия возможно будет страдать», до предложений вроде «Китай — это боль» и «Возможно, это и есть интернет».

Мы подумали, что, возможно, Google просто ошибается в переводе. Но то, что слова получают такие значения — Китай, НАТО, свободный интернет — заставило задуматься. Просто баг? Или шифр внедрён в переводчик намеренно? Неужели с его помощью кто-то может общаться? Что это на самом деле? Майкл Шукри, сотрудник компании FireEye

Как пишет Брайн Кребс, узнавший об открытии странного шифра в Google Translate от одного из своих знакомых, исследователям удалось протестировать «баг» в переводчике всего несколько недель. Начиная с 16 августа слова «Lorem Ipsum», в каком бы виде они ни были написаны, стали выдавать только один вариант перевода — «Lorem Ipsum».

Представитель Google рассказал Кребсу, что интернет-компания обнаружила неисправность в алгоритме переводчика и устранила её. Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев.

Существующий сегодня алгоритм перевода Google Translate был внедрён американской интернет-компанией в 2007 году. Система основывается на постоянном самообучении, улучшая собственные способности за счёт анализа текстов, переведённых с одного языка на другой живыми людьми. Часть языковых пар переводится Google напрямую, другие — через промежуточный перевод на английский язык.

Фраза-шаблон, начинающаяся со слова «Lorem Ipsum», представляет собой искажённый отрывок из трактата древнеримского философа и государственного деятеля Цицерона «О пределах добра и зла». Трактат был написан в 45 году до нашей эры.

Версия фразы, использующаяся дизайнерами при заполнении макетов страниц, не имеет перевода. Оригинальный же кусок, из которого сделан шаблон, выглядит так: «Neque porro quisquam est, qui dolorem ipsum, quia dolor sit, amet, consectetur, adipisci velit» (перевод: «нет никого, кто возлюбил бы, предпочел и возжаждал бы само страдание только за то, что это страдание»).

0
72 комментария
Популярные
По порядку
Написать комментарий...
Удивленный звук

Не, ну тут все понятно. Заговор раскрыт - теперь можно и спать идти

Ответить
60
Развернуть ветку

Комментарий удален

Развернуть ветку

Комментарий удален

Развернуть ветку
Удивленный звук

"Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев."

Ответить
57
Развернуть ветку
Удивленный звук
Ответить
52
Развернуть ветку
Удивленный звук
Ответить
52
Развернуть ветку
Удивленный звук
Ответить
14
Развернуть ветку
Удивленный звук
Ответить
2
Развернуть ветку
Удивленный звук
Ответить
1
Развернуть ветку
Удивленный звук

Пам ПАМ ПАААААААМ

Ответить
0
Развернуть ветку
Удивленный звук
Ответить
43
Развернуть ветку
Удивленный звук

Я уже купил билет в Китай

Ответить
0
Развернуть ветку
Удивленный звук

мурашки по коже пошли

Ответить
26
Развернуть ветку
Удивленный звук

Они и не исправили это, кстати

Ответить
20
Развернуть ветку
Удивленный звук

значит, страдания неизбежны

Ответить
12
Развернуть ветку
Удивленный звук

Если написать Consectetur именно с большой буквы, то вместо России будет Minneapolis

Ответить
7
Развернуть ветку
Удивленный звук

Для особых ценителей тайных шифров

Ответить
13
Развернуть ветку
Удивленный звук

Предвкушаю заголовки пророссийских СМИ "Гугл сказал, что Россия будет страдать", "Переводчик гугла тайно контролируется госдепом США".

Ответить
12
Развернуть ветку
Удивленный звук

дык, все всё давно поняли про гугл) а какой хороший был ютуб, до того, как они его купили.

Ответить
11
Развернуть ветку
Удивленный звук
Ответить
10
Развернуть ветку
Удивленный звук

А тем временем где-то в китайском, например, МИДе или там ЦК Компартии Китая перестала обновляться одна страничка, на которой уже несколько лет висела слегка измененная заглушка "Ipsum ipsum lorem sit...".

Ответить
10
Развернуть ветку
Удивленный звук
Ответить
9
Развернуть ветку
Удивленный звук

Один из принципов обучения перевода: скан множества документов из открытых источников, которые заведомо верно переведены на несколько языков. Это всякие там директивы ООН и т.д. Судя по всему эти документы закончились и в список попали источники с некачественным переводом, в которых в каких-то фрагментах оставляли лорем ипсум. В результате алгоритм накопил достаточно ассоциаций, чтобы заставить вас ложить кирпичи.

Ответить
9
Развернуть ветку
Удивленный звук

Разве алгоритм учитывает с какой буквы пишется слово, с прописной или строчной?

Ответить
0
Развернуть ветку
Удивленный звук

Да. Я это замечал и на других примерах. О причинах нам поведать больше смогут лингвисты, но думаю, что речь идет о распознавании аббревиатур, об определении имен собственных и их части в предложени и т.д. На результат влияет даже точка в конце предложения.

Ответить
5
Развернуть ветку
Удивленный звук

Ясно, спасибо.

Ответить
0
Развернуть ветку
Удивленный звук

Конечно учитывает, весь перевод по сути держится на машинном обучении, включая пунктуацию.

Ответить
0
Развернуть ветку
Удивленный звук

Самое логичное объяснение.

Ответить
0
Развернуть ветку
Удивленный звук

"алгоритм накопил достаточно ассоциаций, чтобы заставить вас ложить кирпичи"
Надо такие алгоритмы отдельно распространнять - годная крипота

Ответить
0
Развернуть ветку
Удивленный звук

Прикрепляйте, пожалуйста, под такими статьями музыку из «Секретных Материалов». А то явно чего-то не хватает.

Ответить
8
Развернуть ветку
Удивленный звук

раньше помнится можно было добавлять свои варианты перевода, и на этом основывалось огромное количество шуток.
например

Ответить
6
Развернуть ветку
Удивленный звук

Ятаки не понял дизайн этой text area

Ответить
0
Развернуть ветку
Удивленный звук
Ответить
6
Развернуть ветку
Удивленный звук
Ответить
5
Развернуть ветку
Удивленный звук

БЕЗНОГNМ!

Ответить
1
Развернуть ветку
Удивленный звук
Ответить
1
Развернуть ветку
Удивленный звук
Ответить
5
Развернуть ветку
Удивленный звук

Ехал Ipsum через Ipsum
Видит Ipsum в реке Ipsum
Сунул Ipsum в реку Ipsum
Ipsum Ipsum Ipsum Ipsum

Ответить
4
Развернуть ветку
Удивленный звук

А еще можно так:
Lorem Ipsum lorem lpsum
lorem Ipsum Lorem lpsum
lorem ipsum lorem lpsum
Ipsum ipsum Ipsum Ipsum

Ответить
1
Развернуть ветку
Удивленный звук

Вау, у вас большая I и маленькая l неотличимые

Ответить
0
Развернуть ветку
Удивленный звук

У вас получилось:
Lorem ipsum lorem lpsum
lorem ipsum lorem lpsum
lorem ipsum lorem lpsum
Very very very very

Ответить
0
Развернуть ветку
Удивленный звук

Ехал ipsum через ipsum
Видит ipsum в lorem ipsum
ipsum ipsum ipsum ipsum
lorem ipsum lore ipsum!

Ответить
3
Развернуть ветку
Удивленный звук

Надеюсь Шукри еще жив.

Ответить
3
Развернуть ветку
Удивленный звук

Спасибо за интернет.

Ответить
2
Развернуть ветку
Удивленный звук

Тот неловкий момент, когда не успеваешь допечатать последнюю букву, а Гугл уже выдаёт перевод...

Ответить
2
Развернуть ветку
Удивленный звук

valar morghulis

Ответить
2
Развернуть ветку
Удивленный звук

Если в Word'е ввести конструкцию вида =lorem(a,b), где a — количество абзацев, а b — количество предложений в каждом абзаце, и нажать enter, то на странице в заданном формате сгенерируется что бы вы думали? Lorem ipsum! Формула =lorem(3,10) даст результат в 3 абзаца по 10 предложений в каждом, а =lorem(10,3) — соответственно, наоборот.

Ответить
2
Развернуть ветку
Удивленный звук

Так и развивается...

Ответить
2
Развернуть ветку
Удивленный звук

Проделки ZOG

Ответить
1
Развернуть ветку
Удивленный звук

Google Переводчик - статистический. Собственно, этим всё и объясняется.

Ответить
1
Развернуть ветку
Удивленный звук

Казалось бы, причём здесь ЦРУ? =))

Ответить
1
Развернуть ветку
Удивленный звук

Синим полотнищем — фаза вершины. Я призываю дух из машины.

Ответить
1
Развернуть ветку
Удивленный звук

Подозреваю, что на подобных фразах разработчики что-нибудь тестировали, а потом попросту забыли убрать

Ответить
1
Развернуть ветку
Удивленный звук

Exactly my point.

Ответить
0
Развернуть ветку
Удивленный звук

./// которая поможет вам принять мою Правду

1) НЕ ПЫТАЙТЕСБ ЧТОТ0 И3МЕНИТЬ!

2) ДУМАNТ3 ТОЛЬКО О СЕБЕ!

3) РУКИ

4) ДОСМОТ?

людей посмотревших сойдут с ума

БЕЗНОГИМ

Получилось? В этом видео звук соджержит слепок V1 o5 u2 наложение — ШИМ

В нем нету ничего злого, но оно пугает. Но после просмотра вы почувствуете радость, и в дальнейшем всё в вашей жизни будет хорошо!

Ваш друг.

Ответить
1
Развернуть ветку
Удивленный звук

Кто с хабра - тот поймет

Ответить
0
Развернуть ветку
Удивленный звук

А вот простая фраза "Ла-ла-ла-ла ла-ла-ла-ла",
хотя и кажется бессмысленной, способна рассказать очень многое о текущей геополитической ситуации без всякого перевода.
Удивительно, правда?

Ответить
–8
Развернуть ветку
Удивленный звук

Вспоминается truecrypt и "If I wish to use the NSA"

Ответить
0
Развернуть ветку
Удивленный звук

Масоны, они повсюду)

Ответить
0
Развернуть ветку

Комментарий удален

Развернуть ветку

Комментарий удален

Развернуть ветку

Комментарий удален

Развернуть ветку
Удивленный звук

Все нормально, это просто AI гугл переводчика обучается и готовится захватить интернет.

Ответить
0
Развернуть ветку
Удивленный звук

Это все жидомассоны

Ответить
0
Развернуть ветку
Удивленный звук
Ответить
0
Развернуть ветку
Удивленный звук

До сих пор же хрень выдает

Ответить
0
Развернуть ветку
Удивленный звук

Вот это самое страшное

Ответить
20
Развернуть ветку
Удивленный звук
Ответить
3
Развернуть ветку
Удивленный звук

Ну там-же машинное обучение. Не разбираюсь в этом, но мне кажется мог кто-то просто пошутить, дав выборку текстов про интернет/Россию/Китай и как их перевод дать Lorem Ipsum. вот и весь заговор.

Ответить
0
Развернуть ветку
Удивленный звук

Это переводчик был обучаем. Можно было собственные переводы добавлять. Вот кто-то и прикололся

Ответить
0
Развернуть ветку
Удивленный звук
Ответить
0
Развернуть ветку
Удивленный звук

теперь все понятно

Ответить
0
Развернуть ветку
Удивленный звук
Ответить
0
Развернуть ветку
Удивленный звук
Ответить
0
Развернуть ветку
Удивленный звук

la-li-lu-le-lo

Ответить
0
Развернуть ветку
Удивленный звук

Алгоритм перевода статистический, и основывается он на параллельных текстах, которые они черпают в том числе и из индексируемых страниц и документов в интернете.

Поскольку часто там, где нет подходящего контента на другом языке, разработчики сайтов лепят "Lorem ipsum dolor sit amet...", то не исключено, что оно попадает в паблик, а затем и в поисковый индекс, и оттуда уже в переводы.

Более подробно - http://borches.livejournal.com/1378263.html

Ответить
0
Развернуть ветку
Удивленный звук

:(. Но спасибо, да.

Ответить
0
Развернуть ветку
Читать все 72 комментария
null