Интернет

Американский режиссёр сделала клип на песню Нины Симон «Feeling Good» с помощью нейросети DALL-E 2 Статьи редакции

Аавтор допустила немного творческих вольностей.

Режиссёр Карен Ченг опубликовала в своих соцсетях клип, созданный с помощью DALL-E 2 — обновлённой версии нейросети, которая генерирует изображения, опираясь лишь на описание на английском языке. Она также может редактировать фотографии, добавляя на них новые предметы и создавать новые рисунки на основе существующих и делать их в духе оригинала.

Ченг рассказала в треде о том, как создавала его, и какие допущения сделала, чтобы «клип» выглядел более впечатляющим.

METHODOLOGY
I took a few artistic liberties with this piece (for a more literal demo, see my post on April 11th)
1. @openaidalle takes about 10 seconds, and generates 10 images. For pacing & storytelling purposes, I picked one image and showed it instantly
Методология. Я позволила себе несколько художественных вольностей. 1. DALL-E 2 генерирует за 10 секунд 10 изображений. Чтобы создать темп, я выбрала одно изображение и сразу же показала его
2. When an existing image was modified (e.g. when the birds and sun were added in the beginning) I did this by first generating the art, then uploading it back into DALL-E with the "edit" tool, erasing portions of the image, and letting it generate over the erased portions
2. Когда существующее изображение изменилось (например, когда в начале добавились птицы и солнце), я сначала сгенерировала рисунок, а затем загрузила его обратно в DALL-E с помощью инструмента «Редактирование». Я удалила части изображения, чтобы нейросеть генерировала их заново
3. In some cases, but not all cases, when you request images of a human, @openaidalle will generate diverse options of people with different ethnicities. When it didn't do this by default, I refined the search to add specific terms in order to get the diversity I wanted
3. В некоторых случаях, но не во всех, когда вы запрашиваете изображения человека, DALL-E генерирует различные варианты людей разных национальностей. Когда он не делал этого по умолчанию, я уточняла запрос, добавив определенные термины, чтобы получить желаемое разнообразие
4. I also added specific phrases (not pictured in the video) in order to generate the image I wanted. E.g, in the first scene, I asked for "a woman standing in a field on an overcast day, oil painting" but in the video I simplified it to "a woman, oil painting" for storytelling
4. Я также добавила определенные фразы (не изображенные на видео), чтобы создать желаемое изображение. Например, в первой сцене мой запрос был «женщина, стоящая в поле в пасмурный день, картина маслом», но в видео я упростил это до «женщина, картина маслом» для повествования

TJ уже рассказывал о результатах работы нейросети.

OpenAI доработала нейросеть DALL-E: теперь она генерирует картинки по текстовому описанию и редактирует уже готовые Статьи редакции

Нейросеть может брать изображение и создавать различные его вариации, изменяя композицию, тени и текстуру.

Что ещё умеет нейросеть DALL-E 2: галерея с новыми примерами изображений от ИИ — удачными и не очень, проблемы и шутки Статьи редакции

Главная претензия к ИИ связана со стереотипами, предвзятостью, сценами насилия и порнографией. Это типично, ведь нейросети «скормили» миллионы изображений из интернета.

Фото бокалов с напитками, сгенерированных нейросетью. Изображение @djbaskin
0
5 комментариев
xbutteff

То чувство, когда даже нейросеть умеет читать букварь, конституцию и рисовать картины маслом лучше, чем нарисованный курс валюты

Ответить
Развернуть ветку
aliftin

Нужно скормить ей треки короля и шута.

Ответить
Развернуть ветку
Fandp Fandp

Такого даже врагу не пожелаешь 🤣

Ответить
Развернуть ветку
aliftin

Вечером может займусь. Хочу почувствовать себе режиссёром.

Ответить
Развернуть ветку
Fandp Fandp

Осом

Ответить
Развернуть ветку
Читать все 5 комментариев
null