Нюдсы, мемы и художники: в соцсетях протестировали нейросеть «Сбера» ruDALL-E для генерации картинок по описанию
От «новой Мона Лизы» до «прекрасной России будущего» — примеры из твиттера, а также от пользователей и редакции TJ.
2 ноября «Сбер» представил сервис ruDALL-E для генерации картинок по описанию на русском языке. На сайте можно ввести любой текст, после чего программа обработает запрос и выдаст результат. Нейросеть состоит из трёх элементов: первая генерирует изображения по заданным параметрам, вторая отбирает самые точные, а третья увеличивает их разрешение.
Подобные проекты на основе искусственного интеллекта появляются не впервые. Например, этим летом набрал популярность англоязычный твиттер-аккаунт, где генерировали абстрактные картинки с помощью похожего инструмента. Правда, там приходилось либо ждать результата от автора аккаунта (часто в течение нескольких дней), либо самому изучать инструкцию.
По словам «Сбера», это первая такая нейросеть с возможностью ввести описание на русском языке. Благодаря этому, а также отсутствию сложных настроек и относительно точным и быстрым результатам, в рунете сервис сразу вызвал волну интереса: из-за нагрузки утром генерация одной картинки занимала около 5-10 минут, а уже во второй половине дня — от 30 минут до часа.
Увеличение времени на обработку связано с большим количеством запросов. Десятки пользователей стали тестировать сервис и делиться результатами в соцсетях, а читатели TJ — в комментариях под новостью. Собрали примеры работ ruDALL-E с просторов интернета, а заодно проверили, как по версии ИИ выглядел бы сам TJournal с его мемами, новостями и редакторами.
Судя по результатам, нейросеть «Сбера» неплохо справляется с простыми или однозначными запросами — такие картинки получаются чёткими, а иногда как будто и вовсе взяты из первых результатов поисковика. Однако с длинными абстрактными описаниями или непопулярными сочетаниями слов результат похож на работу других нейросетей и содержит много неразличимых деталей.
Часть пользователей также обратили внимание на то, что при генерации по запросу «сиськи» нейросеть часто выдаёт изображения птиц. Это заметили также в научном издании N+1, объяснив ошибку переводом. Судя по всему, перед созданием изображение программа переводит описание с русского на английский язык, где «tits» может означать как «сиськи», так и «синицу».
Примеры сгенерированных картинок от редакции
Некоторые примеры картинок от читателей TJ
Примеры картинок, найденные в соцсетях
«Самый красивый пейзаж Вологодской области»
«Облачные сны»
#нейросети #сервисы #сбер