{"id":2163,"url":"\/distributions\/2163\/click?bit=1&hash=003399ef5ae91c93d805aad58972e8e00e970feca71eefd6c596e3f0569dc5a8","title":"\u0421\u0435\u0440\u0432\u0438\u0441 \u0434\u043b\u044f \u0432\u0438\u0434\u0435\u043e\u0437\u0432\u043e\u043d\u043a\u043e\u0432 \u0441 \u0438\u043d\u0442\u0435\u043b\u043b\u0435\u043a\u0442\u0443\u0430\u043b\u044c\u043d\u044b\u043c \u0448\u0443\u043c\u043e\u043f\u043e\u0434\u0430\u0432\u043b\u0435\u043d\u0438\u0435\u043c","buttonText":"\u0413\u0434\u0435 \u0432\u0437\u044f\u0442\u044c?","imageUuid":"6d3f7045-c9c1-5a8d-9e61-eefd5398f49d","isPaidAndBannersEnabled":false}
Интернет

Тред: Нейросеть DALL-E дорисовывает набросок кота Статьи редакции

В начале весны в твиттере провели флешмоб, где пользователи заканчивали рисунок, на котором были только голова и лапы кота. Теперь такую же задачу поставили перед нейросетью.

Пользователи с доступам к нейросетям для генерации картинок продолжают проверять, на что способны продвинутые алгоритмы. Пока одни соревнуются с конкурентами в реализме, а другие, наоборот, пытаются получить наиболее абстрактные изображения, сотрудник токийского офиса Google Brain выяснил, как DALL-E справляется с менее серьёзными заданиями.

Разработчик вспомнил про твит, который разошёлся в соцсети ещё в начале марта. Его автор опубликовал картинку с нарисованными лапами и головой кота и предложил читателям дорисовать животное. Оригинал был выполнен в достаточно примитивном стиле, но пользователи либо делали его ещё более нелепым и абсурдным, либо выкладывали неожиданно качественные работы.

Закончите рисунок кота

На этот раз такую же задачу поставили перед нейросетью — автор давал ей разные описания и выкладывал результаты в твиттер. В итоге получились, например, кот-автобус, кот Шрёдингера или версии котов из «Звёздных войн» и «Крёстного отца». При этом алгоритм почти всегда сохранял стиль шаблона, поэтому все работы выглядят как настоящие рисунки.

Ответ на публикацию @memesiwish
“Finish the cat drawing” viral meme tweet has replies with all sorts of nice, creative ‘out of the box’ thinking.

I use #Dalle’s inpainting function to do this task, and was impressed at what it can do. Here is the output using the prompt “cats”

🧵An entire thread of results 🐈 https://twitter.com/memesiwish/status/1502260368613130244
Вирусный мемный твит «закончи рисунок кота» собрал креативные примеры мышления вне рамок. Я использовал функцию рисования DALL-E, чтобы выполнить ту же задачу и остался под впечатлением. Вот, например, результат по описанию «кошки»
Oh boy, this is going to be a fun thread.

Let’s start with “James Bond”

#Dalle
Оу, блин, это будет весёлый тред. Давайте начнём с «Джеймса Бонда»
I wanted it to come up with some photo-realistic image in the body, using all sorts of tricks, like text conditioning with the words photo, natural, etc., but it was hard.

If I used the prompt "DSLR photo" it simply gave me a photograph of the cat operating a digital camera :)
Я пытался добиться фотореалистичного результата разными свободами, например, дополняя запросы словами «фото», «натуральный» и так далее, но получалось с трудом. Если использовать запрос «фото на зеркалку», то сеть просто выдавала фотографию кота, который пользовался камерой
Of course, I gotta try "robot". The first one had a name called "Aabe" (from "Aibo" of the dog fame?)

The third one has a "root" prompt.

The last one was a bit disturbing, as the cat was "cat-handling" its friend...
Конечно, я должен был попробовать «робота». Первый получил имя Aabe (от знаменитого робопса Aibo?). В третьем примере я использовал запрос «root». Последняя картинка немного пугает, потому что кот «котобрабатывает» друга
Next up, "bus", since you gotta get the cat bus up.

I also tried "vehicle" too:
Далее, «автобус», раз уж мы решили заавтобусить кота. Заодно попробовал и «транспорт»
Frustrating with the lack of colors, I tried "Abstract color painting", and it came up with this:
Мне было грустно из-за отсутствия цветов, так что я попробовал «цветная абстрактная картина», и получилось это:
I tried the prompt "F-16" to get the cat jet plane.

I guess the results were more American than if I had used other types of jet planes...
Я попробовал запрос «F-16», чтобы превратить кота в истребитель. Полагаю, результат получился более американизированным, чем если бы я ввёл другое название
Here is #Dalle's attempt to make the cat a "Gundam":
А вот попытка DALL-E превратить кота в Гандама
Let's see if we can get something rendered in 3D, from this originally 3D line sketch, using the prompt "3D Render" #Dalle
Давайте проверим, получится ли что-то зарендерить в 3D из этого изначально двухмерного наброска, используя запрос «3D-рендер»
If I use the prompt "Fashion model", #Dalle would generate fashion models from the cat, but the last one was this skinny cat, with a French-sounding name next to the cat?
Если использовать запрос «модная модель», DALL-E сгенерирует моделей из котов, хотя на последней картинке получился просто худой кот, рядом с которым написано имя, которое звучит по-французски
"Banksy Graffiti" generated:

1) Cat as Banksy holding a can of spray paint
2) Graffiti with the phrase "Fattining" (or something)
3) Actual Cat-looking Graffiti

#Dalle
Сгенерировал «граффити Бэнкси». 1) Кот в образе Бэнкси держит балончик с краской. 2) Грффити с надписью «Fattining» (или что-то такое). 3) Реально граффити, похожие на котов
"Captain Amerca" Cat #Dalle

I supposed this one is relatively straightforward...
Кот «Капитан Америка». Я решил, что это относительно точно
“Origami” of the cat, occasionally with a smaller origami friend licking its behind... #Dalle
«Оригами» кота, иногда вместе со своим маленьким оригами-другом, который облизывает его сзади
The "Sushi" prompt in #Dalle rarely fails to deliver!

Here are solutions with Sushi inserted into the doodle:
Запрос «суши» в DALL-E редко подводит. Вот несколько результатов с суши, вписанными в рисунок
"Sushi" is so good that it deserves another tweet: #Dalle
«Суши» настолько хороши, что заслуживают ещё один твит
I can get more variety by making more regions of the original image available for inpainting.

What usually happens is that it lets the second pair of feet become another cat or another person.

For example, here is the solution to the prompt: "A painting of a body builder":
Я могу добиться ещё большего разнообразия, увеличив зону, где сеть может рисовать. Обычно после этого вторая пара лап превращается в ещё одного кота или человека. Например, это результат по запросу «Рисунок бодибилдера»
When I try "A ukiyo-e painting of a body builder", it interpreted ukiyo-e as Japanese, and produced:

(1) A body builder with the cat's original head as his tattoo

(2) E-Honda...
Когда я попробовал ввести «рисунок бодибилдера в стиле укиё-э», он определил укиё-э как что-то японское и выдал: 1) Бодибилдера с тату в виде оригинальной головы кота; 2) Э. Хонду [из Street Fighter]
The same prompt "A ukiyo-e painting of a body builder" also produced some more feminine images too. #Dalle
Тот же запрос «рисунок бодибилдера в стиле укиё-э» также выдал несколько изображений женщин
Try to fuse the cat with a bird with the prompt "Photograph of a Bird" #Dalle
Попытался смешать кота с птицей с помощью описания «фотография птицы»
"Photograph of Cleopatra" didn't produce any photographs, but wasn't so bad. #Dalle
«Фотография Клеопатры» не выдала никаких фотографий, но получилось не так уж и плохо
“Cyberpunk painting of a cat programming on a laptop, digital art” produced some interesting results, including one image where the original cat head became the 'hat' thing of an actual 'cyberpunk cat' with nerdy glasses. #Dalle
«Киберпанк-рисунок кота, который программирует на ноутбуке, цифровой арт» выдал несколько интересных результатов, включая одно изображение, на котором оригинальная голова превратилась в шапку на голове реального киберпанк-кота в задротских очках
This one is quite creative:

“Star Wars: The Empire Strikes Back” #Dalle
Это довольно креативно: «Звёздные войны: Империя наносит ответный удар»
Note that "Star Wars" doesn't work in #Dalle because it doesn't like the word "Wars".

But pro-tip: "Starwars" works :)

Here are more cat inpainting images produced by #Dalle using the same prompt from the above tweet:
Отмечу, что «Звёздные войны» не работает в DALL-E, потому что ему не нравится слово «война». Но есть лайфхак: работает «ЗвёздныеВойны». Вот ещё несколько картинок, сгенерированных по запросу из прошлого твита
Who would've thought that #Dalle can fit a "Mandelbrot Fractal" into the cat doodle?!
Кто бы мог подумать, что DALL-E сможет поместить «фрактал Мандельброта» в рисунок кота?
#Dalle will generate some crazier "Mandelbrot Fractal"’s if I give it a little bit more flexibility in the feet area:
DALL-E сгенерирует ещё более безумные «фракталы Мандельброта», если я дам ему больше пространства в районе лап
#Dalle inpainted the doodle as “Schrödinger's cat”

I think only the nerds will get this one.
DALL-E дорисовал рисунок по запросу «кот Шрёдингера». Думаю, это поймут только нёрды
“Tom Cruise in "Top Gun"” with the cat using #Dalle

I still have to go watch Top Gun 2.
«Том Круз в „Топ Гане“» с котом по версии DALL-E. Всё ещё нужно сходить и посмотреть вторую часть
The Cat in “The Godfather (1972)” #Dalle

You can do anything. But never go against the family.
Кот в «Крёстном отце (1972)». Ты можешь делать что угодно. Но никогда не иди против семьи

Ранее другой разработчик уже протестировал DALL-E на такой же задаче, но показал всего несколько результатов с менее абсурдными запросами.

Картинка, созданная по описанию «Если бы кот носил штаны, он бы носил их так или так?»
0
3 комментария
Вальдемар

Сука когда уже релизнут хочется потыркать эту нейросеть сил нет

Ответить
Развернуть ветку
Духовный чувак

Уровень «Безногим»

Ответить
Развернуть ветку
Духовный чувак

­

Ответить
Развернуть ветку
Читать все 3 комментария
null