Ми продовжуємо ділитися з вами публікаціями на тему нейромереж та їхніх можливостей. Нещодавно ми розповідали про ChatGPT і про те, чому це відмінний помічник для всіх, хто працює з текстом (і не тільки). А сьогодні поговоримо про зображення!
Як і раніше, ми на реальних прикладах подивимося, наскільки якісними й релевантними будуть отримані результати. І, звичайно ж, поділимося своїм алгоритмом дій. Покажемо, на що здатна сучасна нейромережа, а з чим вона поки не може впоратися.
Невелика передмова
Google любить унікальний вміст — це факт. Але, коли ми говоримо про унікальність, зазвичай йдеться саме про тексти. Зображення дуже часто залишаються без належної уваги. Але вони теж відіграють роль у ранжуванні. Умовно кажучи, з двох ідентичних сайтів вище в пошуковій видачі буде той, який використовує оригінальні зображення.
Варіантів отримання таких картинок кілька: купівля на фотостоках (необов'язково гарантує унікальність, оскільки інші теж можуть використовувати ті самі зображення), створення самостійно, найняття фотографа, дизайнера або іншого фахівця, який буде працювати над графічною складовою вашого контенту. І ось недавно став стрімко набирати обертів ще один спосіб — генерація зображень за допомогою нейромереж.
Список популярних нейромереж для генерації зображень
Взагалі існують десятки функціональних платформ, здатних генерувати цілком задовільні картинки, ґрунтуючись на описах (промптах). Є навіть ті, які можуть «перемалювати» ваш простий ескіз і створити з нього справжній витвір мистецтва. Ми можемо назвати декілька найпопулярніших:
Багато нейромереж генерують зображення у хмарі. І це для більшості пріоритетний варіант, тому що робота нейромережі вимагає великих обчислювальних потужностей. Створення картинки 512×512 пікселів може виявитися вкрай трудомістким завданням навіть для відносно нових і досить потужних комп'ютерів. Рекомендується використовувати пристрої macOS із чіпами М1 або М2, які якраз непогано справляються з подібними завданнями.
Звідси випливає порада: якщо у вас немає високопродуктивного комп'ютера, використовуйте хмарні нейромережі. Інакше доведеться витрачати по 10-20 хвилин на генерацію навіть маленького зображення. Навряд чи цей процес принесе вам задоволення.
Але все-таки від теорії переходьмо до практики!
Генеруємо зображення за допомогою Midjourney
Ми вибрали саме цю нейромережу з трьох причин:
- Midjourney — наразі одна з передових технологій.
- Нейромережа дійсно добре «розуміє», що від неї хочуть.
- З нею можна генерувати до 15 зображень безплатно, а спритні користувачі напевно знайдуть спосіб це обмеження обійти.
Єдине, що робить використання цієї нейромережі дещо незручним, — потреба реєструватися в Discord, щоб взаємодіяти з ботом Midjourney та надсилати йому запити/промпти. Це нескладно, але вимагає від вас трохи часу.
Ми не будемо розписувати процес реєстрації та під’єднання бота нейромережі, оскільки в інтернеті цієї інформації просто маса. Ви знайдете її без особливих зусиль. Перейдемо відразу до справи!
Як зробити запит у Midjourney для створення зображень
Тут усе просто. У чаті Discord після під’єднання бота Midjourney достатньо ввести /imagine і ваш запит — що саме повинна згенерувати нейромережа.
Промпт повинен бути англійською мовою!
Почнемо з простого! Припустимо, ми пишемо текст про просування сайтів і нам потрібне зображення чоловіка в костюмі, що сидить за комп'ютером в офісі. Власне, такий запит ми й вводимо в текстове поле:
Натискаємо Enter й отримуємо кілька варіантів:
Зверніть увагу! Автоматично Midjourney генерує відразу чотири варіанти картинки ОДНИМ зображенням і зі співвідношенням сторін 1:1. Але це можна змінити. Подробиці — далі.
Погодьтеся, вийшло цілком непогано. Але!
Особисто в нас відразу виникають два побажання:
- Ми хочемо, щоб зображення були більш реалістичними, а не мальованими.
- Нам потрібно отримати картинку зі співвідношенням сторін не 1:1, а 16:9.
- Чоловіка не завадило б омолодити.
І так, усе це можна зробити!
Але нам доведеться дещо розширити й ускладнити наш запит:
На цьому моменті рекомендуємо зупинитися та прочитати наш промпт уважніше, щоб зрозуміти, що саме ми там позначили. Ми не просто попросили Midjourney додати реалізму, але й написали, що це повинна бути імітація фото з конкретними налаштуваннями фотокамери, з кольорокорекцією та з високою роздільною здатністю.
Ось такий результат ми отримали:
Як бачите, різниця в порівнянні з минулим варіантом просто колосальна!
Ви можете використовувати наш промпт, а можете змінити його на свій розсуд. Наприклад, перетворити чоловіка на жінку, зістарити або омолодити персонажа, переодягнути, змусити посміхатися й багато-багато іншого. Тут усе обмежується лише вашою фантазією.
До речі, поверніться до скриншоту нашого промпту вище та зверніть увагу на короткі замітки в самому кінці. 8k — це не параметр, а підказка для нейромережі, що зображення має бути у високій роздільній здатності. А ось з іншими не так очевидно:
- --ar 16:9 — співвідношення сторін;
- --q 2 — якість зображення (від 0,25 до 2);
- --v 4 — версія Midjourney.
Є й інші корисні параметри:
- --hd — генерація зображення з високою роздільною здатністю;
- --w — ширина;
- --h — висота;
- :: — пріоритетність слів у промпті (наприклад, full body::10 man::1).
Але рухаймося далі!
Як ми з'ясували, Midjourney генерує відразу кілька зображень і склеює їх. Можна просто вирізати одне з них у будь-якому графічному редакторі, але роздільна здатність буде дуже невисокою. На щастя, так робити зовсім не обов'язково.
У Midjourney є всі необхідні вам функції — ви можете збільшити будь-який із варіантів зображення, а також попросити нейромережу зробити ще кілька варіантів вибраної картинки. Усе це робиться в один клік:
Якщо жоден із варіантів вам не подобається, натисніть кругові стрілки, і нейромережа згенерує зображення заново.
Припустимо, нам сподобався перший варіант, але хочеться подивитися кілька альтернативних картинок, схожих на нього. Натискаємо V1 і чекаємо, поки нейромережа згенерує нам чотири нові зображення, відштовхуючись від першого варіанту:
На перший погляд може здатися, що картинки ідентичні. Але придивіться — вони відрізняються.
Тепер нам подобається третій варіант, і ми готові його використовувати на своєму сайті. Натискаємо U3 та чекаємо, поки нейромережа збільшить нашу картинку:
Ми отримали чудове зображення з роздільною здатністю 1568×896 пікселів. Більш ніж достатньо для публікації на сайті, у блозі або в соцмережах.
Зверніть увагу! Після апскейлу під картинкою з'являються додаткові варіанти дій: Light Upscale Redo, Beta Upscale Redo і Make Variations. З ними теж можна поекспериментувати, але наразі вони працюють не завжди коректно й іноді відверто псують зображення. Плюс збільшена картинка може дещо відрізнятися від «оригіналу», оскільки нейромережа не просто робить апскейл, а перемальовує його.
До речі, ви звернули увагу на косяк у роботі нейромережі (а разом із нею — і наш)?
Поверніться до перших чотирьох «реалістичних» варіантів і придивіться уважніше. Тільки на двох зображеннях перед чоловіком стоїть дисплей. У тому варіанті, який вибрали ми, монітори стоять за людиною. Тобто нейромережа не завжди спрацьовує коректно, і її потрібно контролювати, у разі потреби змінюючи промпти, додаючи та видаляючи частини запитів.
Midjourney — це не тільки про портрети. Ще більше можливостей для креативу!
Midjourney може створювати справді чудові портрети. Вони настільки реалістичні, що відрізнити їх від реальних фотографій часом дуже складно.
Просто подивіться на пару жіночих портретів, які ми створили:
Чудово, правда?
Але можливості нейромережі куди ширше!
Наприклад, ми можемо попросити її згенерувати зображення робочого місця, використовуючи простий промпт: laptop, ux ui, social network, workspace, --q 5 --ar 16:9.
Можемо попросити підготувати декілька ілюстрацій для якої-небудь хоррор-розповіді. Для цього використовуємо промпт: cabin in a mysterious forest, moonlight, fog, realistic, 8k --ar 16:9.
А можемо навіть згенерувати зображення для нового серіалу The Last Of Us від HBO. Як промпт використовуємо назву серіалу — the last of us.
Так можна продовжувати до нескінченності.
Але ми ще хотіли розповісти вам про деякі нестандартні й корисні способи застосування Midjourney, а також поділитися корисними промптами. Використовуйте їх як доповнення до своїх основних запитів.
Піксель-арт
Є кілька промптів, за допомогою яких можна створювати стильні піксельні зображення:
- 8 bit pixel art / 16 bit pixel art / 32 bit pixel art;
- game boy style / SNES style / PlayStation style;
- isometric.
Дизайн логотипів
Тут можна експериментувати:
- Paul Rand / Saul Bass / Massimo Vignelli — імена відомих дизайнерів, чийого стилю ви хочете дотримуватися (будь-які достатньо відомі);
- simple / flat / vector — загальні промпти для лого та векторної графіки;
- kitschy / elegant / minimal — стилі зображень.
Ми попросили нейромережу згенерувати дизайн логотипа для вебстудії Elit-Web. Ймовірно, у вас виникнуть питання до результату, але до цього ми ще повернемося.
Кіноплакати
Можна використовувати назву фільму, щоб згенерувати зображення в потрібній вам стилістиці. Працює часом навіть дуже добре!
Дизайн інтерфейсів
Є декілька популярних промптів, за допомогою яких можна генерувати різні інтерфейси:
- vector;
- user interface;
- Adobe Illustrator / Figma;
- Dribbble / Behance.
Midjourney не завжди точно розуміє, який саме результат ви хочете отримати. Але іноді видає дійсно симпатичні варіанти.
Ізометричні ілюстрації
Можна отримати дуже цікаві зображення, використовуючи такі промпти:
- isometric;
- low-poly;
- box cutout;
- made in blender;
- матеріали: matte clay.
Ілюстрації у стилі Paper Art
Надзвичайно красиві та стильні ілюстрації, які часом здаються абсолютно реалістичними. Можете спробувати самі, використовуючи додаткові промпти:
- layered paper craft;
- paper art;
- diorama.
Ми попросили зробити діораму для «Володаря перснів». Не беремося стверджувати, що фільм або книга вгадується, але виглядає симпатично, чи не так?
У чому ж ложка дьогтю в цій бочці меду?
Midjourney, та й інші нейромережі, що генерують зображення, — це справжня знахідка для креативників усіх рівнів. Але ж ми перерахували лише малу частину їхніх можливостей і варіантів використання. Вони фактично не обмежені.
Але будемо з вами чесними — той же Midjourney далеко не завжди спрацьовує ідеально. І в деяких випадках видає вкрай спірні результати. А є сценарії, у яких нейромережа й зовсім працює відверто погано:
- Взаємодія людини (і не тільки людини) з різними об'єктами.
Іноді нейромережа абсолютно не розуміє, як люди взаємодіють із предметами. Наприклад, ми попросили Midjourney зобразити дівчину, яка фотографує себе у дзеркалі. Вийшло ... місцями страшно:
- Проблемні руки.
Людські руки та лапи тварин — «болюче місце» нейромереж. Якраз вони зазвичай і видають роботу того ж Midjourney. Зайві пальці, неприродне їхнє положення, дивна форма нігтів — це часом дуже сильно впадає в очі. Дивіться самі:
- Текст на зображеннях.
Вище ми показували вам приклад згенерованого логотипа для Elit-Web. Проблема в тому, що ви не можете сказати Midjourney, який текст повинен бути на малюнку. Він у найкращому випадку підбере якісь схожі символи. А тому взяти та за пару секунд згенерувати собі готове лого не вийде. Зате можна почерпнути кілька цікавих ідей і далі втілити їх у життя самостійно. Наприклад, тут теж повинно було читатися Elit-Web:
Замість висновку
Підсумувавши все вищесказане та дивлячись на результати роботи нейромереж, ми з впевненістю можемо сказати, що їх дійсно можна використовувати для створення зображень під найрізноманітніші завдання. Вони відкривають просто колосальні можливості для креативу та втілення неординарних, часом відверто божевільних ідей. І працюють при цьому надзвичайно швидко!
Так, дивлячись на деякі результати, можна констатувати, що алгоритми все ще неідеальні. Але ви тільки погляньте, наскільки стрімко навчилася нейромережа Midjourney з березня по листопад 2022 року. Ось вам найпростіший приклад — кіт!
А уявіть, що буде ще за рік? А за п'ять років? Не знаємо, як ви, а ми з нетерпінням чекаємо оновлень і стежимо за трендами в цьому напрямку.
Сподіваємося, вам було цікаво! Ймовірно, ми ще повернемося до цієї теми в майбутньому, тому що розвиток нейромереж просто нестримний. І вже через кілька місяців нам напевно буде що обговорити.
Залишіть ваші контактні дані.
Будемо раді обговорити ваш проект!