В переводчике Google нашли основанный на латыни тайный шифр Статьи редакции

Сотрудники компании FireEye обнаружили в переводчике Google тайный шифр, основанный на латинской фразе «Lorem Ipsum», использующейся в интернете в качестве бессмысленного текста для заполнения пустого места на макетах веб-страниц. Об этом в своём блоге 18 августа сообщил специалист по кибербезопасности Брайан Кребс.

Шифр удалось обнаружить исследователю FireEye Майклу Шукри (Michael Shoukry) и его помощнице, не называющей своего реального имени и пользующейся в сети никнеймом Kraeh3n.

Секретный «язык» оказался встроен в сервис Google Translate. При вводе в поле перевода латинского словосочетания «lorem ipsum», написанного с двух строчных букв, сервис сообщал, что по-английски оно означает «Китай». Обратный порядок слов — «ipsum lorem» — переводился как «интернет». Те же слова, но написанные с заглавных букв — «Lorem Ipsum» — выдавали аббревиатуру Организации Североатлантического альянса, НАТО (NATO).

Ввод в Google Translate ещё нескольких версий написания фразы позволял обнаружить и другие засекреченные слова. Большая их часть была так или иначе связана со всемирной сетью и Китаем.

Дублируя фразу один или два раза в различном написании и с разным порядком слов, Шукри и Kraeh3n удалось составить таблицу таких странных переводов, складывавшихся уже не в отдельные слова, а в целые предложения. В большинстве своём предложения не имели смысла и были не закончены — «Пожалуйста, проверьте, что автомобиль», «Запуск в Китае и китайский», «Запуск Китая и интернет», «Это повредило маркетинговой технологии», «О самой игре», «Китайский интернет-феномен», «Интернет-технологии в Китае», «Спасибо за интернет» и так далее.

Дальнейшие исследования показали, что в качестве шифра использовались не только первые два слова из текста шаблонной фразы, а вся фраза целиком, в полной версии выглядящая вот так.

Перевод разных отрывков текста выдавал порой самые удивительные результаты — от фраз о том, что «Россия возможно будет страдать», до предложений вроде «Китай — это боль» и «Возможно, это и есть интернет».

Мы подумали, что, возможно, Google просто ошибается в переводе. Но то, что слова получают такие значения — Китай, НАТО, свободный интернет — заставило задуматься. Просто баг? Или шифр внедрён в переводчик намеренно? Неужели с его помощью кто-то может общаться? Что это на самом деле? Майкл Шукри, сотрудник компании FireEye

Как пишет Брайн Кребс, узнавший об открытии странного шифра в Google Translate от одного из своих знакомых, исследователям удалось протестировать «баг» в переводчике всего несколько недель. Начиная с 16 августа слова «Lorem Ipsum», в каком бы виде они ни были написаны, стали выдавать только один вариант перевода — «Lorem Ipsum».

Представитель Google рассказал Кребсу, что интернет-компания обнаружила неисправность в алгоритме переводчика и устранила её. Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев.

Существующий сегодня алгоритм перевода Google Translate был внедрён американской интернет-компанией в 2007 году. Система основывается на постоянном самообучении, улучшая собственные способности за счёт анализа текстов, переведённых с одного языка на другой живыми людьми. Часть языковых пар переводится Google напрямую, другие — через промежуточный перевод на английский язык.

Фраза-шаблон, начинающаяся со слова «Lorem Ipsum», представляет собой искажённый отрывок из трактата древнеримского философа и государственного деятеля Цицерона «О пределах добра и зла». Трактат был написан в 45 году до нашей эры.

Версия фразы, использующаяся дизайнерами при заполнении макетов страниц, не имеет перевода. Оригинальный же кусок, из которого сделан шаблон, выглядит так: «Neque porro quisquam est, qui dolorem ipsum, quia dolor sit, amet, consectetur, adipisci velit» (перевод: «нет никого, кто возлюбил бы, предпочел и возжаждал бы само страдание только за то, что это страдание»).

0
72 комментария
Написать комментарий...
Вредный танк88

Не, ну тут все понятно. Заговор раскрыт - теперь можно и спать идти

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Металлический единорожек88

"Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев."

Ответить
Развернуть ветку
Индийский чайник
Ответить
Развернуть ветку
Детский блик
Ответить
Развернуть ветку
Любопытный Артем
Ответить
Развернуть ветку
1 комментарий
Серый дебаркадер
Ответить
Развернуть ветку
Целесообразный франт

Пам ПАМ ПАААААААМ

Ответить
Развернуть ветку
Невозможный корабль

Комментарий недоступен

Ответить
Развернуть ветку
Спортивный кавалер

Я уже купил билет в Китай

Ответить
Развернуть ветку
Идеальный глобус

мурашки по коже пошли

Ответить
Развернуть ветку
Индийский чайник

Они и не исправили это, кстати

Ответить
Развернуть ветку
Видный корабль

значит, страдания неизбежны

Ответить
Развернуть ветку
Ежегодный цвет

Если написать Consectetur именно с большой буквы, то вместо России будет Minneapolis

Ответить
Развернуть ветку
Импортный парфюмер

Для особых ценителей тайных шифров

Ответить
Развернуть ветку
Персональный танк88

Предвкушаю заголовки пророссийских СМИ "Гугл сказал, что Россия будет страдать", "Переводчик гугла тайно контролируется госдепом США".

Ответить
Развернуть ветку
Истинный жар

дык, все всё давно поняли про гугл) а какой хороший был ютуб, до того, как они его купили.

Ответить
Развернуть ветку
Турецкий ящик
Ответить
Развернуть ветку
Мощный кофе

А тем временем где-то в китайском, например, МИДе или там ЦК Компартии Китая перестала обновляться одна страничка, на которой уже несколько лет висела слегка измененная заглушка "Ipsum ipsum lorem sit...".

Ответить
Развернуть ветку
Сердечный шмель
Ответить
Развернуть ветку
Старший бокал

Один из принципов обучения перевода: скан множества документов из открытых источников, которые заведомо верно переведены на несколько языков. Это всякие там директивы ООН и т.д. Судя по всему эти документы закончились и в список попали источники с некачественным переводом, в которых в каких-то фрагментах оставляли лорем ипсум. В результате алгоритм накопил достаточно ассоциаций, чтобы заставить вас ложить кирпичи.

Ответить
Развернуть ветку
Товарный меч

Разве алгоритм учитывает с какой буквы пишется слово, с прописной или строчной?

Ответить
Развернуть ветку
3 комментария
Решающий микрофон

Самое логичное объяснение.

Ответить
Развернуть ветку
Грустный рубин

"алгоритм накопил достаточно ассоциаций, чтобы заставить вас ложить кирпичи"
Надо такие алгоритмы отдельно распространнять - годная крипота

Ответить
Развернуть ветку
Подобный теркин30см

Прикрепляйте, пожалуйста, под такими статьями музыку из «Секретных Материалов». А то явно чего-то не хватает.

Ответить
Развернуть ветку
Смертельный магнит

раньше помнится можно было добавлять свои варианты перевода, и на этом основывалось огромное количество шуток.
например

Ответить
Развернуть ветку
Турецкий ящик

Ятаки не понял дизайн этой text area

Ответить
Развернуть ветку
Принятый глобус
Ответить
Развернуть ветку
Турецкий ящик
Ответить
Развернуть ветку
Решающий микрофон

БЕЗНОГNМ!

Ответить
Развернуть ветку
Методический Слава
Ответить
Развернуть ветку
Тепловой корабль
Ответить
Развернуть ветку
Научный лолипоп

Ехал Ipsum через Ipsum
Видит Ipsum в реке Ipsum
Сунул Ipsum в реку Ipsum
Ipsum Ipsum Ipsum Ipsum

Ответить
Развернуть ветку
Научный лолипоп

А еще можно так:
Lorem Ipsum lorem lpsum
lorem Ipsum Lorem lpsum
lorem ipsum lorem lpsum
Ipsum ipsum Ipsum Ipsum

Ответить
Развернуть ветку
2 комментария
Изящный Артем

Ехал ipsum через ipsum
Видит ipsum в lorem ipsum
ipsum ipsum ipsum ipsum
lorem ipsum lore ipsum!

Ответить
Развернуть ветку
Богатый звук

Надеюсь Шукри еще жив.

Ответить
Развернуть ветку
Легкий фонарь

Спасибо за интернет.

Ответить
Развернуть ветку
Московский Никита

Тот неловкий момент, когда не успеваешь допечатать последнюю букву, а Гугл уже выдаёт перевод...

Ответить
Развернуть ветку
Геологический Женя

valar morghulis

Ответить
Развернуть ветку
Хороший месяц

Если в Word'е ввести конструкцию вида =lorem(a,b), где a — количество абзацев, а b — количество предложений в каждом абзаце, и нажать enter, то на странице в заданном формате сгенерируется что бы вы думали? Lorem ipsum! Формула =lorem(3,10) даст результат в 3 абзаца по 10 предложений в каждом, а =lorem(10,3) — соответственно, наоборот.

Ответить
Развернуть ветку
Медленный вентилятор

Так и развивается...

Ответить
Развернуть ветку
Саратовский коктейль

Проделки ZOG

Ответить
Развернуть ветку
Базовый меч

Google Переводчик - статистический. Собственно, этим всё и объясняется.

Ответить
Развернуть ветку
Нынешний Илья

Казалось бы, причём здесь ЦРУ? =))

Ответить
Развернуть ветку
Смутный Гоша

Синим полотнищем — фаза вершины. Я призываю дух из машины.

Ответить
Развернуть ветку
Милицейский Валера

Подозреваю, что на подобных фразах разработчики что-нибудь тестировали, а потом попросту забыли убрать

Ответить
Развернуть ветку
Практический историк

Exactly my point.

Ответить
Развернуть ветку
Неподвижный бинокль

./// которая поможет вам принять мою Правду

1) НЕ ПЫТАЙТЕСБ ЧТОТ0 И3МЕНИТЬ!

2) ДУМАNТ3 ТОЛЬКО О СЕБЕ!

3) РУКИ

4) ДОСМОТ?

людей посмотревших сойдут с ума

БЕЗНОГИМ

Получилось? В этом видео звук соджержит слепок V1 o5 u2 наложение — ШИМ

В нем нету ничего злого, но оно пугает. Но после просмотра вы почувствуете радость, и в дальнейшем всё в вашей жизни будет хорошо!

Ваш друг.

Ответить
Развернуть ветку
Сибирский кофе

Кто с хабра - тот поймет

Ответить
Развернуть ветку
Согласный диод

А вот простая фраза "Ла-ла-ла-ла ла-ла-ла-ла",
хотя и кажется бессмысленной, способна рассказать очень многое о текущей геополитической ситуации без всякого перевода.
Удивительно, правда?

Ответить
Развернуть ветку
Сумасшедший череп

Вспоминается truecrypt и "If I wish to use the NSA"

Ответить
Развернуть ветку
Выдающийся коктейль

Масоны, они повсюду)

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Природный ГОСТ

Все нормально, это просто AI гугл переводчика обучается и готовится захватить интернет.

Ответить
Развернуть ветку
Верхний паук например

Это все жидомассоны

Ответить
Развернуть ветку
Адекватный калькулятор
Ответить
Развернуть ветку
Экспертный волк

До сих пор же хрень выдает

Ответить
Развернуть ветку
Экспертный волк

Вот это самое страшное

Ответить
Развернуть ветку
1 комментарий
Структурный космос

Ну там-же машинное обучение. Не разбираюсь в этом, но мне кажется мог кто-то просто пошутить, дав выборку текстов про интернет/Россию/Китай и как их перевод дать Lorem Ipsum. вот и весь заговор.

Ответить
Развернуть ветку
Вертикальный якорь

Это переводчик был обучаем. Можно было собственные переводы добавлять. Вот кто-то и прикололся

Ответить
Развернуть ветку
Здравый самолет
Ответить
Развернуть ветку
Ледяной микроскоп

теперь все понятно

Ответить
Развернуть ветку
Напряженный Валера
Ответить
Развернуть ветку
Напряженный Валера
Ответить
Развернуть ветку
Природный ГОСТ

la-li-lu-le-lo

Ответить
Развернуть ветку
Городской рубин

Алгоритм перевода статистический, и основывается он на параллельных текстах, которые они черпают в том числе и из индексируемых страниц и документов в интернете.

Поскольку часто там, где нет подходящего контента на другом языке, разработчики сайтов лепят "Lorem ipsum dolor sit amet...", то не исключено, что оно попадает в паблик, а затем и в поисковый индекс, и оттуда уже в переводы.

Более подробно - http://borches.livejournal.com/1378263.html

Ответить
Развернуть ветку
Стандартный меч

:(. Но спасибо, да.

Ответить
Развернуть ветку
Читать все 72 комментария
null