6

Ответ Xellmod в «Обложка, нейросеть и прочее»

Собственно итог моих ручек и установки нейросети, сначала увидев в ссылках гитхаб настроение было достаточно скептическое. Потом еще ссылку на актуальный питон мой антивирус заблокировал, мол она находится в черном списке. Отключила антивирус, установила питон. Оказалось, неправильно установила, батник не видел. Почитала интернет, говорят в системные переменные не прописалось, удалила питон выбрала костомную установку, там, к моей радости, была галочка о том, чтоб пути прописать в системные переменные. Скачала модель с ссылки в описании, пришлось регистрироваться на сайте, почитала условия использования модели, вроде норм. Далее решила без GFPGAN, так в инструкции вещь опциональная. Грузилось долго. Но вот наступил радостный час, оно установилось. Решила засунуть в нейросеть для проверки недорисованную обложку для книги, закончить которую просто не осталось сил.

Обложку не закончила, книга сейчас находится на литрес.
Собственно результат получился забавным

Вот эта кнопка вообще не работает, просто что-то пытается бесконечно грузить

Решила разбить картинку на элементы и начать с дамы с рогами, после нескольких попыток получилось вот это

Результат меня воодушевил, но радость была не долгой. Мужика рисовать оно не хотело

Снесла нейросеть(тупо удалила папку с ней) установила заново. И все равно не получился желаемый результат

хотя некоторые концептуальные изображения все еще были

Далее перешла к пернатому, с ним тоже повезло больше, хотя и не идеально

Есть подозрения, что я что-то делаю не так, в изначальном посте работа нейросети выглядела как какое-то чудо.

В любом случае даже в таком виде, это достаточно мощный инструмент для создания каких-то иллюстраций и обложек, но все еще не кнопка «сделай красиво» Кстати первое, что она мне нарисовала было голой феей, ее прикреплять не буду)

@zebrazebra5 вроде было интересен результат. Собирать все элементы назада на картину не стала.
Показать полностью 10
41

Ответ на пост «Обложка, нейросеть и прочее»

Теперь как то же самое можно сделать проще.


Здесь рассматривается работа с локально установленной нейросетью. Для неё нужна видеокарта с 6+ (лучше больше, 8+) гигабайтами памяти. Всё то же самое можно сделать через веб-сайт с работающей stable diffusion img2img. Где-то он был.


-------


Берём, например, stable diffuion от automatic1111:

https://github.com/AUTOMATIC1111/stable-diffusion-webui


Устанавливаем. Запускаем, идём вы браузере на localhost:7860


Берём исходную картинку, копируем в буфер обмена.

(Взято с поста: @VictoriaLu, Обложка, нейросеть и прочее )


Идём на вкладку img2img, втыкаем её туда через Ctrl+V или перетаскиванием. Жамкаем "interrogate", чтобы компьютер определил, что там вместо нас. Получается так:

"a drawing of a woman with blue eyes and a black shirt on, with a white background and a blue wing, by Elfriede Lohse-Wächtler"


В принципе, правильно, убираем хлам, и левого художника (by ELfriede...). Интеррогатор имеет привычку добавлять странных художников, и, например, почему-то думает, что пишущего Епифанцева нарисовал Квентин Тарантино. Убираем лишнее, добавляем художника в запрос. Например, так:


"a drawing of a woman with blue eyes and a black shirt on, with a white background and a blue wing, by Greg Rutkowski"


Далее, ставим следующие настройки:

Sampling Steps: 20

Sampling Method: k_euler_a

Batch Size: 1

Cfg Scale: 7

Denoising Strength: 0.5

Это настройки по умолчанию, кроме Denoising Strength. Denoising Strength определяет, как сильно нейросеть будет фантазировать. На практике, 0.3..0.4 - слабая ретушь. 0.5 - сохранит позу и, может быть, мелкую мимику. 0.6 и выше - начинает терять позу и фантазировать. 0.75 - будет фантазия на тему, слабо связанная с оригиналом. При низком значении Denoising Strength, можно задрать CFG Scale до 9 или даже 15, но увеличится шанс артефактов. Важно то, что низкие значения меньше меняют исходную картинку, но при этом артистический стиль будет намного более слабо выражен. Т.е. картинка может получиться хуже или менее интересной, если Denois Strength слабое.


Выглядят настройки так:

Если хотим несколько вариантов, задираем Batch Count, если хотим править лица, жамкаем "Restore Face", если картинка не квадратная, выбираем между Crop and Resize (обрежет длинные стороны и сделает квадрат, емнип) и Resize and Fill (растянет узкие стороны до квадрата, заполнит пикселями с границ).


Жмём "генерить", получается нечто вроде вот этого:

Пользоваться можно, но стиль выражен слабо. Это потому что у нас мало шагов (steps) - 20. Это как если бы мы художнику оригинал отдали на ретушь, дали ему проработать 2 минуты, а потом выперли и отобрали работу. Поднимаем до 50, получится что-то в духе этого:

Появился стиль, но оно всё ещё сильно опирается на оригинал и слабо похоже на рутковского. Поднимаем Denoising Strength до 0.65. Получится похоже на оригинал, но теперь будет больше свободы. И можем получить что-то в таком духе:

Стиль есть, позу потеряли.


Если нравится конкретное лицо, но хочется поиграться с параметрами, под картинкой ищем "Seed" и копируем цифровое значение в настройки слева. Лицо каждый раз будет одно и то же.

Для более цветной картинки делаем более цветное пятно любым способом, либо задираем Denoise Strength до 0.75, но тогда нейросеть начнёт фантазировать/фонтанировать на тему.


Рекомендуется генерировать несколько вариантов за раз, т.к. лица будут разные, и какое-то одно может понравиться больше. Пробуем.

Куда-то движемся, но он очень хочет рисовать рубашку. Убираем "black shirt", заменяем "wing" на "wings". Результат:

Ну и дальше играемся с параметрами до победного конца. Denoise выше/ниже (свободы больше/меньше), докидываем модификаторов или переделываем стартовый набросок.

Показать полностью 9
1

Обложка, нейросеть и прочее

Это мой итоговый результат созданный моими усилиями и еще усилиями нескольких нейросетей, но обо всем по порядку. Сначала я нарисовала от пятна достаточно кривой рисунок.

потом решила воспользоваться услугами приложения по улучшению качества Topaz Gigapixel AI не сочтите за рекламу(жёлтые линии и крылья, это мое творчество, нейросеть просто сделала чётче и доработала волосы)

Вот этот результат я взяла и отправила в нейросеть dream в качестве референса.  Есть и лучше варианты, например MIDJOURNEY, но там нужно было идти в дискорд и почему-то бот сначала взялся за мой заказ, но после удалил результат. Итак dream нарисовал мне вот это(результат немного обрезан)

достаточно жуткое зрелище, но лицо пропорционально и с этим можно работать. Кстати в  группе в вк academicart, не знаю уж чье апи они используют,но бот мне выдал такой вот результат обработки моего рисунка

Но вернемся к результату dream, мне нравились цвета и наличие крыла  потому я взяла его, далее с помощью сайта thispersondoesnotexist.com сгенерировала несколько нормальных лиц для донорства органов.

Собственно дльше спустя несколько часов работы с фотошоп, у меня получилось вот это

Глаза и рот темнокожей, нос бледнолицей. Крыло мне дорисовал сам фотошоп с помощью инструмента "заливка с учетом содержимого" нашла на стоках бесплатное фото космоса и использовав фильтр из галлереи сделала его фоном. Осталось только подписать и использовать для обложки на ютуб) На обложку пошло уже вот так

Видео, не видео, а аудио рассказ, там про космическую станцию и вроде бы, даже интересно.

Показать полностью 7 1
Отличная работа, все прочитано!