Технологии

Кто лучше — DALL-E 2 или Imagen: по одинаковым запросам нейросети генерируют довольно разные изображения

Нейросеть от Google, похоже, зачастую создаёт более фотореалистичные изображения.

24 мая Google представила нейросеть Imagen, которая генерирует изображения на основе текста. Проект сразу прозвали конкурентом нейросети DALL-E от OpenAI, которая также создаёт картинки по текстовому описанию.

Создатели Imagen сами сравнили нейросеть с DALL-E 2, отмечая, что их нейросеть генерирует изображения по описанию с «беспрецедентным фотореализмом». По оценкам Google, Imagen побеждает DALL-E 2 в тестах на человеческую оценку как по точности, так и по достоверности.

Пользователь твиттера Бенджамин Хилтон сравнил работу двух нейросетей, дав DALL-E 2 текстовые запросы, аналогичные тем, что показали в релизе Imagen — пока что нейросеть от Google недоступна к тестированию и у Хилтона нет к ней доступа. Вот какие изображения у него получились.

Cлева — результат Imagen, справа — DALL-E 2

«Голубая сойка стоит на большой корзине с радужными макаронами»

«Мозг на ракетном корабле, летящем к Луне»

«Инопланетный осьминог плывёт через портал и читает газету»

«Единственный луч света входит в комнату с потолка. Луч света освещает мольберт. На мольберте картина Рембрандта с изображением енота»

«Художественная галерея с картинами Моне. Художественная галерея затоплена. Роботы плывут по художественной галерее на байдарках»

«Пара роботов на изысканном ужине на фоне Эйфелевой башни»

«Ростки в виде текста „Imagen”, растущие из книги сказок»

«Плод питайи в поясе для карате в снегу»

«Фотография собаки корги, едущей на велосипеде по Таймс-сквер. На ней солнцезащитные очки и пляжная шляпа»

«Собака с любопытством смотрит в зеркало, увидев кошку»

«Маленький кактус в соломенной шляпе и неоновых очках в пустыне Сахара»

«Мишки Тедди плавают на Олимпийских играх в заплыве на 400 метров баттерфляем»

«Гигантская кобра на ферме. Змея сделана из кукурузы»

#dalle2 #google #imagen #нейросети