{"id":2162,"url":"\/distributions\/2162\/click?bit=1&hash=6bdf5aec9e03e74234b2d7162aacaa2e1177031d0b3a681065b591c8f5741742","title":"\u0417\u0432\u043e\u043d\u0438\u0442\u044c \u0438\u0437 \u041a\u0430\u043b\u0438\u043d\u0438\u043d\u0433\u0440\u0430\u0434\u0430 \u0432 \u042f\u043a\u0443\u0442\u0438\u044e \u043f\u043e \u0432\u0438\u0434\u0435\u043e \u0431\u0435\u0437 \u0437\u0430\u0434\u0435\u0440\u0436\u0435\u043a","buttonText":"\u0410\u043b\u043b\u043e!","imageUuid":"bc8e606b-9a50-5550-a16e-3fed09971ed5","isPaidAndBannersEnabled":false}
Технологии

Нейросеть DALL-E заподозрили в создании своего языка. Оказалось, что это случайный набор букв с элементами латыни Статьи редакции

В кодировке нейросеть используются термины на латыни.

Пользователь твиттера @giannis_daras заподозрил, что нейросеть DALL-E, генерирующая картинки по текстовому описанию, имеет секретный язык. Он сделал запрос: «Два фермера говорят об овощах с субтитрами» и получил изображение, на первый взгляд, c бессмысленным текстом «Vicootes» и «Apoploe vesrreaitars».

Следом пользователь дал нейросети запрос «Vicootes» — и DALLE-2 выдала ему блюда с овощами. А по запросу «Apoploe vesrreaitars» получились птицы. На основе этого пользователь сделал вывод, что, похоже, фермеры говорят о птицах, которые возятся со своими овощами.

Другой пример: по запросу «Два кита говорят о еде с субтитрами» получается изображение с написанным на нем текстом «Wa ch zod rea». Если вбить такой запрос DALL-E, то та выдаёт картинки блюд с морепродуктами.

Тестировщик отметил, что некоторые слова из «языка» DALL-E можно использовать для создания абсурдных подсказок. Например, запрос «картина Apoploe vesrreaitais» даёт изображение птицы. Пользователь сделал предположение, что «Apoploe vesrreaitais» означает для модели «нечто, что летает» и может использоваться в самых разных стилях.

Если теория верна, то «Apoploe vesrreaitais» означает «птицы»; «Contarra ccetnxniams luryca tanniounons» означает жуков или вредителей; «Vicootes» означает «овощи».

Однако, похоже, что никакого собственного языка у DALL-E вообще-то нет

Другой тестировщик, @BarneyFlames, взглянул на кодировку имени, которую DALL-E использует для обозначения птиц. Это «apo, plo, e, ve, sr, re, ait, ais». Apo-didae и Ploceidae — это латинские названия семейства птиц, каждое из которых насчитывает более 100 видов. А Apo-diformes — крупнейший отряд птиц, насчитывающий более 400 видов птиц.

Более того, оказалось, что часто нейросеть выдаёт обычную тарабарщину — при проверке, отнюдь не на все запросы DALLE-2 выдавала что-то, что соответствует описанию на «секретном» языке.

Например, как утверждал пользователь @giannis_daras, «Contarra ccetnxniams luryca tanniounons» означает жуков или вредителей. Однако по этому запросу у другого пользователя, @benjamin_hilton, DALL-E выдала много разных животных.

Кроме того, ключом к заявлениям о «секретном языке» DALL-E является то, что эти термины применяются ко всем подсказкам DALL-E, в том числе в более сложных, когда, например, идёт запрос на изменение стиля. Однако если добавить к тексту «Contarra ccetnxniams luryca tanniounons» «3D-render», то в 3D получаются объекты, связанные с морем — а совсем не жуки.

А запросы «Contarra ccetnxniams luryca tanniounons, cartoon« (то есть задание нарисовать всё в мультяшном стиле) и «Contarra ccetnxniams luryca tanniounons, painting» (в стиле живописи) почему-то выдают пожилых женщин.

Примечательно так же, что если добавить к запросу «Apoploe vesrreaitais» (что якобы означает на языке DALL-E «птицы») , уточнения стиля, то нейросеть начинает показывать результаты с жуками.

Как утверждал @giannis_daras, «Vicootes» означает «овощи». Но если уточнить стиль изображения, то нейросеть выдаёт совсем другое — странных персонажей, случайные объекты, цветы и пейзажи.

Иными словами, очень похоже на то, что никакого «секретного языка» у нейросети нет. Некоторые запросы могут быть подкреплены реальными названиями видом на латыни, но в большинстве случаев это — рандом.

Более того, DALL-E, кажется, избегает демонстрации текста

Заставить нейросеть выдать картинку с каким-либо текстом тоже оказалось не так уж просто. В примере @giannis_daras используется фраза «Два кита говорят о еде с субтитрами». Но когда пользователь @benjamin_hilton попробовал сделать то же самое, нейросеть очень долго не выдавала ему варианты с хоть сколько-то разборчивым текстом. Пока, наконец, не показала вот это:

Если исходить из того, что у DALL-E есть собственный язык, то «Evve waeles» должно означать что-то связанное с едой, китами или морем. На деле же по такому запросу нейросеть выдала десерты, футболистов, животных и чайник.

0
12 комментариев
Написать комментарий...
плюшевый батон

Как же хочется поиграться с таким. Какой самый простой способ добиться этого?

Ответить
Развернуть ветку
Boris Britva

Хочешь поиграться с DALL-E, вкатывайся в программисты и сделай своего DALL-E сам. Тут тебе помогут курсы от Коробкинавыков. Заказав курсы сегодня по моему промокоду, ты получишь скидку в 12%!

Ответить
Развернуть ветку
kinrany
Ответить
Развернуть ветку
Елена Кравицкая

жалкая пародия на первую версию)

Ответить
Развернуть ветку
kinrany

Открытое, свободное и бесплатное воспроизведение первой версии!

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Renegade

Имхо она вообще сырая. Пытался сгенерить там космонавта, не получилось. с натягом удалось создать кота по самому примитивному запросу, и то плохого качества.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Renegade

Мне пиздец как нужна эта штука.
Я даже денег бы заплатил.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Renegade

Ну дак, для пирата с 15-летним стажем это сильное заявление. Они должны этим гордиться :D

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Читать все 12 комментариев
null