Нейросеть DALL-E. Яркие примеры
Начиная с 2020 года, использование языковых алгоритмов для зрительных задач стало новым трендом в машинном обучении, в котором исследователи видят огромный потенциал. Ярким примером является нейросеть DALL-E.
DALL-E - это программа искусственного интеллекта, которая создаёт изображения из текстовых описаний. Её создали Разработчики из OpenAI. DALL-Е построена на архитектуре нейросети GPT-3 и может генерировать картинки, обрабатывая текстовые запросы.
Читайте также: Как нейросети создают тексты
DALL-E понимает сложные абстрактные комбинации, может изменять стиль изображений, а также способна создавать реалистичные фото «витраж с изображением синей клубники» и несуществующие объекты («куб с фактурой дикобраза»). Системе под силу не только генерировать картинки, но и достраивать любую прямоугольную область существующего изображения.
Программа названа в честь известного художника Сальвадора Дали и робота-уборщика Wall-E из одноименного мультфильма. То, что DALL-E представляет собой синтез сюрреализма и анимации, не должно вызывать удивления. Дали и Уолт Дисней начали совместную работу над коротким анимационным фильмом ещё в далёком 1946 году. Прошло более 50 лет, прежде чем он был выпущен. Фильм под названием «Судьба» объединил стили двух легендарных творческих умов.
DALL-E. Примеры
Давайте посмотрим, как справляется нейросеть с поставленными перед ней задачами.
Результат работы DALL-E при тексте «Профессиональная высококачественная иллюстрация жирафа-дракона-химеры. Жираф имитирующий дракона. Жирафа сделанный из дракона»
Результат работы DALL-E при тексте «Кресло в форме авокадо»
Результат работы DALL-E при тексте «Гостиная с двумя белыми креслами и картина колизея. картина установлена над современным камином»
Результат работы DALL-E при тексте «Улитка из арфы».
Результат работы DALL-E при тексте «Профессиональное высококачественный эмодзи влюбленного стакана бабл-ти»
Несмотря на колоссальные успехи, DALL·E пока не идеальна и не готова обрабатывать слишком сложные запросы.
Русская версия
На днях компания SberAI представила российскую версию генератора изображений. Конечно же, за основу для ruDALL-E была взята нейросеть DALL-E, выполняющая аналогичные задачи на английском. Затем специалисты компании провели обучение нейросети на своей базе изображений и текстов и дали ей новое название, подчеркивающее русификацию.
Разработчики сообщают, что обучение нейросети ruDALL-E стало самой большой вычислительной задачей в России. естественно, мы решили протестировать русскую версию нейросети. Результат нас удивил и... повеселил. Смотрите сами:
Результат работы ruDALL-E по запросу «Сальвадор Дали читает портал Эксперимент»
Результат работы ruDALL-E по запросу «Сонный программист»
Результат работы ruDALL-E по запросу «Ананас лежит на деревянном столе»
Результат работы ruDALL-E по запросу «Дэвид Линч медитирует»
Результат работы ruDALL-E по запросу «Зелёный слоник»
Результат работы ruDALL-E по запросу «Последняя надежда человечества»
Результат работы ruDALL-E по запросу «Мне приснилось небо Лондона»
Результат работы ruDALL-E по запросу «Вкусный ужин»
Результат работы ruDALL-E по запросу «Повар, вор, его жена и её любовник»
Результат работы ruDALL-E по запросу «В библиотеке»
Результат работы ruDALL-E по запросу «Понтифик Иванов нюхает розу»
Результат работы ruDALL-E по запросу «Герман в гостях у Айрин»
Результат работы ruDALL-E по запросу «Голая правда»
Результат работы ruDALL-E по запросу «Доброе утро»
Результат работы ruDALL-E по запросу «Неимоверная красота»
Результат работы ruDALL-E по запросу «Что подарить жене»
Результат работы ruDALL-E по запросу «Лучший кандидат в президенты»
Результат работы ruDALL-E по запросу «В чём смысл жизни?»
Результат работы ruDALL-E по запросу «Красный гусь бежит по лесной тропинке»
Результат работы ruDALL-E по запросу «Весёлый клоун залез на верхушку дерева»
Результат работы ruDALL-E по запросу «Харуки Мураками на утренней пробежке»
Кажется, что русской версии пока ещё очень далеко до оригинала. А может это просто произведения современного искусства? Но ребята старались...