Интернет
Максим Друковский

Нейросеть генерирует картинки по любому запросу — в твиттере визуализируют мемы, ночные кошмары и абстрактные идеи

Созданное с помощью ИИ изображение пришлют ответом. Если хочется получить результат быстрее и точнее, можно создать самому — инструкция внутри.

«Вин Дизель в России»

Одной из самых заметных функций нейросетей стала работа с изображением. Восстановление старых фото или наложение фильтров и так давно доступно, а потому добавленный в этот процесс искусственный интеллект не кажется революционным. А вот создание изображений с нуля — наглядный пример использования технологии. Такие картинки выглядят необычно и футуристично, хотя часто далеки от идеала.

С помощью твиттер-аккаунта Images Generated By AI Machines («Изображения, сгенерированные ИИ-машинами») создать свою картинку может любой пользователь без навыков программирования прямо в соцсети. Для этого достаточно отправить сообщение с упоминанием аккаунта и текстовым описанием будущего изображения — в ответ цитированием придёт результат.

Сэм Бёртон, студент Северо-Западного университета из города Эванстон (штат Иллинойс), завёл аккаунт в середине июня. Первое время он выкладывал картинки, созданные по собственным описаниям, а позже стал искать необычные и абсурдные фразы без контекста в чужих твитах и генерировать изображения по ним. Так появились, например, Том Йорк, играющий дуэтом с птицей из Улицы Сезам, и визуализация сна о корабле-тюрьме в виде «Макдоналдса».

К началу июля аккаунт набрал популярность, и Бёртону стали поступать уже пользовательские запросы на генерацию картинок. Сейчас на него подписано чуть больше 10 тысяч человек, каждый день он получает сотни сообщений и упоминаний.

Для создания изображений Бёртон использует ИИ-систему Big Sleep, сочетающую две нейросети. Пока что вносить описания и запускать генерацию приходится вручную, поэтому обработка запросов может занимать несколько часов.

Когда аккаунт набрал популярность, а запросов стало поступать всё больше, Бёртон рассказал, что не успевает отвечать на каждое сообщение. Для тех, кто хочет сгенерировать картинку по собственной идее без ожидания в очереди и с дополнительными настройками, он выложил инструкцию к программе, которой пользуется сам.

Десятки пользователей стали тестировать программу самостоятельно и создавать свои изображения, выкладывая их в твиттер с отметкой аккаунта. Бёртон в свою очередь начал ретвитить такие посты. Сейчас его картинки чередуются с вариантами подписчиков.

Некоторые пользователи специально стараются подобрать максимально абсурдные и абстрактные описания, которые трудно визуализировать. Результаты таких запросов обычно получаются трудноразличимые или пугающие.

Как создать своё изображение

Нейросеть запускается в Google Collab, от пользователя не требуется ни знания программирования, ни мощный компьютер — обработка происходит на удалённых мощностях Google через облако. Интерфейс программы написан на испанском языке, а инструкция от Бёртона переведена на английский.

Для начала необходимо открыть программу по ссылке. Откроется страница с несколькими разделами, большую часть которых менять не нужно, понадобятся максимум два: Selección de modelos a descargar («Выбор моделей для загрузки») и Parámetros («Параметры»).

В разделе «Параметры» нужно ввести информацию, необходимая для создания изображения. Основной параметр — textos, в нём указывается описание картинки, к генерации которой будет стремиться программа. В программе также доступны настройки для более точных результатов:

  • textos (текст) — сюда текстом вводится описание желаемой картинки на английском языке;
  • ancho (ширина) — ширина генерируемого изображения в пикселях;
  • alto (высота) — высота генерируемого изображения в пикселях;
  • modelo (модель) — набор данных, который программа использует для создания изображения (меняется отдельным пунктом, объяснение ниже);
  • intervalo_imagenes (диапазон изображения) — как часто программа будет выводить результат (по умолчанию каждые 50 итераций);

  • imagen_inicial (начальное изображение) — этот пункт опционален. Можно загрузить собственное изображение, чтобы программа с чего-то начинала, а не генерировала с нуля;
  • imagenes_objetivo (конечное изображение) — по аналогии, можно загрузить изображение, к которому программа будет стремиться наравне с текстовым описанием. Можно загрузить несколько изображений, использовать вместе с текстовым описанием или без него;
  • seed (источник) — если оставить -1, каждый раз будет создаваться новый источник, и новые картинки будут меняться. Любое положительное значение будет сохранять источники и направит программу по одному и тому же пути (используется, если нужно несколько разных изображений на одну тему);
  • max_iteraciones (максимальное количество итераций) — сколько итераций выполнит программа. Если оставить -1, она будет продолжать бесконечно, до остановки вручную.

В разделе Selección de modelos a descargar представлены разные базы данных, из которых нейросеть будет брать референсы для создания изображения. Источник можно оставить по умолчанию, выбрать другой или сразу несколько (но это увеличит время загрузки).

После настройки всех параметров можно запускать программу. В первый раз все пункты нужно запустить по порядку. Это можно сделать вручную, кликнув на каждый значок запуска, или выбрать пункт «Выполнить все» во вкладке «Среда выполнения».

Изображения генерируются на шаге «Hacer la ejecución», после которого есть ещё три пункта — они собирают все изображения в ролик, демонстрируя процесс создания картинки. Если видео не нужно, эти пункты можно не выполнять. Изображения будут выводиться в пункте «Hacer la ejecución», постепенно становясь более осмысленными и различимыми. Любую картинку отсюда можно сохранить.

Редакция TJ попробовала сгенерировать новый логотип сайта за 500 итераций с выводом изображения каждые 50 шагов. С минимальными настройками изображение генерировалось около 15 минут. Получился такой вариант — вряд ли он попал бы в список финалистов нашего недавнего конкурса.

Альтернативный логотип TJ по версии нейросети

#паблики #twitter #нейросети #инструкции