«Сбер» представил нейросеть Kandinsky для генерации изображений по описанию на русском языке
В компании уверяют, что она генерирует более реалистичные картинки, чем предыдущая нейросеть от «Сбера».
Модель Kandinsky — это улучшенная версия нейросети ruDALL-E, которую «Сбер» представил в ноябре 2021 года, сообщила компания. Она доступна в мобильном приложении «Салют» и на «умных» устройствах «Сбера» по запросу «Включи художника».
Команды Sber AI и SberDevices улучшили работу базовой модели, дообучив ее на 179 млн изображений, снабжённых текстовыми описаниями.
Kandinsky может создавать любые изображения на основе текстового описания: дизайн интерьера, иллюстрации, материалы для рекламы и другого, говорят в компании.
Она способна генерировать изображения с произвольным соотношением сторон, а также лучше справляется с созданием реалистичных изображений с качественной передачей тени, текстур и отражений.
Создание изображений при помощи Kandinsky происходит в три этапа. Сначала Kandinsky на основе текстового описания генерирует заданное количество картинок, затем другая нейросеть — ruCLIP Large — выбирает наиболее удачные. После этого третья нейросеть увеличивает их в размере.
#новости #нейросети #сбер