Штучний інтелект може створювати мистецтво, гідне визнання, але все ще не здатний конкурувати з людською творчістю
Автор: Джозеф Ерлі, аспірант зі штучного інтелекту Саутгемптонського університету
Існує переконання, що творчість притаманна людині. Проте штучний інтелект (ШІ) досяг тієї стадії, коли він також може бути творчим.
Нещодавній конкурс викликав обурення серед художників після того, як на ньому присудили нагороду художньому твору, який був намальований моделлю ШІ, відомою як Midjourney. Тепер таке програмне забезпечення є у вільному доступі завдяки випуску подібної моделі під назвою Stable Diffusion («Стабільна дифузія»), яка на сьогодні є найефективнішою у своєму роді.
Спілки креативних практиків, такі як Stop AI Stealing the Show («Не дозволимо ШІ захопити мистецтво»), вже протягом деякого часу висловлюють занепокоєння щодо використання штучного інтелекту у творчих сферах. Але чи може ШІ замінити людей-митців?
Різноманітні зображення роботів, створені автором за допомогою ШІ Stable Diffusion
Ці нові моделі ШІ створюють безмежні можливості. Кожне зображення роботів, яке показано вище, є унікальним, але створене Stable Diffusion на основі схожих запитів користувачів.
Є два способи використання цих штучних інтелектів-художників: написати коротку текстову підказку або ще додати до неї зображення, щоб надати додаткові вказівки. За допомогою підказки з 12 слів я зміг створити кілька образів логотипу для вигаданої компанії, яка доставляє фрукти. Трохи менше, ніж за 20 хвилин. На моєму ноутбуці середнього класу.
Дизайн для компанії, що швидко постачає свіжі фрукти, логотип, висока контрастність, полівініл – підказка, яку я використовував, щоб ШІ Stable Diffusion створив ці зображення
Як ви можете побачити з наведених вище результатів, Stable Diffusion намагається створити мистецтво за допомогою слів. Але деякі фрукти трохи дивні.
І все ж я ніяк не міг би створити нічого подібного без використання штучного інтелекту чи допомоги графічного дизайнера. Також я не зміг би створити зображення роботів сам.
Потенціал цієї технології не залишився непоміченим – стартап Stability AI, який створив Stable Diffusion, планує залучити мільярд доларів інвестицій у цю галузь. Але ці моделі штучного інтелекту починають впливати на реальний світ, як це спостерігається з удостоєного нагороди зображення від Midjourney. Штучний інтелект справді успішно продукує твори красного мистецтва, які поєднують різні елементи та стилі.
Хоча штучний інтелект може зробити більшу частину роботи за вас, використання цих моделей все одно вимагає навичок. Іноді підказка створює не зовсім те зображення, яке ви хотіли. Або ШІ можна використовувати разом з іншими інструментами, тоді він становить тільки невелику частину більшого процесу творчості.
І створення красного мистецтва відрізняється від створення цифрових дизайнів. Stable Diffusion краще малює пейзажі, ніж логотипи.
Чому Stable Diffusion змінює правила гри
Моделі штучного інтелекту зазвичай навчають створювати мистецтво, використовуючи набір даних, що містить приголомшливі 5,85 мільярда зображень. Цей величезний обсяг даних потрібен, щоб штучний інтелект міг дізнатися про вміст зображення та художні концепції. І це дуже довго обробляється.
Для Stable Diffusion знадобилося 150 000 годин (трохи більше 17 років) процесорного часу. Однак це можна скоротити до менш ніж місяця реального часу шляхом паралельного навчання на великих обчислювальних кластерах (групи потужних комп’ютерів, що працюють як один пристрій).
Stability AI також надає онлайн-інструмент під назвою DreamStudio, який дозволяє використовувати його модель ШІ за ціною близько 0,01 долара США за зображення. Для порівняння, використання художньої моделі DALL·E 2 від конкурента OpenAI коштує в десять разів більше.
Обидва методи використовують той самий базовий підхід, відомий як комп’ютерна програма дифузійної моделі, яка вчиться створювати нові зображення, переглядаючи безліч наявних. Однак Stable Diffusion має нижчу обчислювальну вартість, тобто вимагає менше часу для навчання, та споживає менше енергії.
Ба більше, ви не можете самостійно завантажити та запустити модель OpenAI, тільки взаємодіяти з нею через вебсайт. Водночас Stable Diffusion – це проєкт із відкритим вихідним кодом, з яким може поекспериментувати кожен. Тож завдяки участі онлайн-спільноти програмістів він користується такими перевагами швидкого розвитку, як: удосконалення моделей і посібників користувача, інтеграція з іншими інструментами. Це вже відбувалося протягом кількох тижнів після випуску Stable Diffusion у серпні 2022 року.
Майбутнє мистецтва?
За останні п’ять років було зроблено значні покращення, хоча все ще є проблеми, з якими художнім моделям штучного інтелекту доводиться стикатися. Слова в їхніх художніх творах впізнавані, але часто не мають сенсу. Так само штучному інтелекту важко відобразити людські руки.
Художнім моделям штучного інтелекту все ще важко правильно відтворювати руки. Зображення, створене автором за допомогою ШІ Stable Diffusion.
Існує також очевидне обмеження, адже ці моделі можуть створювати лише цифрове мистецтво. Вони не можуть працювати з олійними фарбами чи пастеллю як люди. Подібно до того, як повернувся вініл, технологія може спочатку перейти на новий формат, але згодом люди завжди повертаються до оригінальної форми з найвищою якістю.
Зрештою, як показали попередні дослідження, моделі штучного інтелекту в їх нинішньому вигляді радше правитимуть за нові знаряддя для художників, аніж стануть цифровою заміною творчої особистости. Наприклад, штучний інтелект міг би створити низку зображень, що стануть відправною точкою для художників, які здійснюватимуть їх подальший відбір і вдосконалення.
Це поєднує в собі переваги художніх моделей ШІ (швидке відтворення та створення зображень) із сильними сторонами людей-митців (бачення художнього твору та подолання проблем з моделями ШІ). Особливо це актуально у випадку робіт на замовлення, коли потрібен конкретний результат. ШІ сам по собі навряд чи зможе створити те, що вам потрібно.
Проте небезпека для митців залишається. Цифрові художники, які вирішать не використовувати ШІ, ризикують залишитися позаду, не зможуть підтримувати високі темпи праці та нижчі витрати художників, які покладаються на штучний інтелект.
Стаття вперше була опублікована англійською мовою під назвою «AI can produce prize-winning art, but it still can’t compete with human creativity» в журналі The Conversation 30 вересня 2022 р.
Переклали Давид Курачов, Яна Руча і Катерина Шарабура