Искусственный интеллект создает изображения на основе картинок с описанием. Иногда получаются очень сюрреалистические вещи

Автор:
Дмитрий Мрачник
Дата:

Лаборатория исследования искусственного интеллекта OpenAI разработала нейросеть, которая создает картинки на основе исследования множества изображений и текстовых описаний к ним. Из-за сюрреалистических результатов творчества нейросеть назвали DALL·E — это производное от имен знаменитого художника-сюрреалиста Сальвадора Дали и робота Уолли из одноименного мультфильма.

DALL·E создает очень интересные картины, смешивая людей, животных, неодушевленные объекты, узоры и текст. Нейросеть демонстрирует, что язык может стать инструкцией, следуя которой искусственный интеллект создает изображения с достаточно высокой точностью. Таким образом, сочетание визуальной и текстовой информации для подобной технологии — уже достигнутая вершина.

Но иногда результаты такого творчества совсем неожиданные. Например, нейросеть создала серию изображений кресла в виде авокадо.

Скриншот / OpenAI

Или несколько картинок, на которых ребенок-овощ в юбке выгуливает собаку.

Скриншот / OpenAI

Среди других изображений — расплавленные очки, странные чайники, стаканы, существование которых невозможно и тому подобное.

Скриншот / OpenAI

В частности, DALL·E способна делать трехмерные модели объектов с различных ракурсов, умеет работать с оптическими эффектами. Для нейросети нужно правильно сформулировать описания к картинкам. Например, в предложении «ежик в красной шляпе, желтых перчатках и в зеленых штанах» искусственный интеллект не только должен правильно определить указанные объекты, но и сформировать ассоциации, не смешивая их.

Чем больше объектов получает для анализа DALL·E и чем абстрактнее их описания, тем больше возникает путаницы между объектами и ассоциациями. Иногда нейросеть самостоятельно заполняет «пробелы» в предложениях, подыскивая объекты, которые не упоминаются, но которые должны присутствовать по ассоциации.

Скриншот / OpenAI

Также DALL·E экспериментирует с объектами, которые не могут существовать в реальности — разработчики объясняют, что эта способность уже ближе к искусству.

В OpenAI отмечают, что технология имеет большой потенциал для широкого влияния на общество. На примере результатов работы нейросети можно будет анализировать такие проблемы, как экономическое влияние на определенные профессии и рабочие процессы, предубеждения и тому подобное.