Сообщество - Midjourney

Midjourney

4 384 поста 2 863 подписчика

Популярные теги в сообществе:

120

Кукла колдуна и Мертвый анархист - новые иллюстрации от нейросети по мотивам песен "Король и Шут"

Источник: НейроМэш

Показать полностью 8
1

Китайская Красная Шапочка с иллюстрациями Midjourney и Dream

Для ЛЛ: результат вот ↓

Это вторая часть заметок об иллюстрации Красных Шапочек. Начало здесь.

Как я писал в первой части, свои основные косяки я увидел лишь после того, как видео было опубликовано, поэтому решил попробовать проиллюстрировать еще одну песню — про Китайскую Красную Шапочку. Сложностей было две:

  1. Видео песни записано горизонтально, и у меня больше нет шикарной возможности одновременно держать в кадре исполнителя и иллюстрации.

  2. У автора песни очень богатая мимика, которую не хотелось перекрывать рисунками нейросетей.

Поигрался в видеоредакторе с созданием мини-кадра на переднем плане основного кадра, все вроде получилось, приступил к иллюстрациям.

«Вдали от Пекина, в китайском лесу» — я знаю, что Пекин существует, но как выглядит его самое узнаваемое место, не представляю. Обратился к поисковику, нашел такую фотографию:

Очень красиво! Пытался использовать это изображение как опорное в Midjourney, и результат всегда был хуже оригинала. Пришлось попросить ИИ просто нарисовать ночной Пекин (очень уж понравилась реальная ночная фотография) таким, каким его себе представляет нейросеть. Вот результат:

Третий кадр пошел в иллюстрации.

И обратите внимание: при апскейле не только увеличивается разрешение, но и перерабатываются некоторые детали, например, верх здания в центре кадра.

С первыми словами первого куплета разобрались, двигаемся дальше, к «китайскому лесу». Никаких проблем, ИИ спокойно рисует реалистичный бамбуковый лес в Китае:

«Волк встретил случайно селянку Янь-Цзу» — да сколько угодно, выбирай на вкус:

и еще:

Создавались и совсем маленькие дети в красных шапочках, но, памятуя, что Янь-Цзу в одиночку тащит по лесу гору продуктов, в итоге выбрал такую:

Изображать застывшего Волка я не стал, переведя фокус на исполнителя в кадре, а затем позволив зрителю еще раз посмотреть на красоту девушки.

«За это спасибо китайцу-отцу.
И маме китайской, и дяде Фун-Цзу.
»

Очень быстрый ритм. Если менять рисунки с частотой слов, можно эпилепсию вызвать у зрителя. Другой вариант: сделать групповой портрет с подписями кто есть кто. Третий вариант: контурные рисунки как у Штирлица в «Семнадцати мгновениях весны»:

Интересная идея, но я так не умею. Сделаем три карты и будем их открывать поочередно, тогда зритель успеет рассмотреть картинки. Ну, я так думаю. И подписи добавить! Но тогда зритель точно не успеет, фокус сместится на подписи... А мы сделаем подписи на китайском, и тогда ничего никуда не сместится. Наверное. Но это не точно. В общем, сделал.

Портреты получились с первой же попытки по запросам: «китаец-отец», «мама китайская» и «китайский дядя по имени Фун-Цзу»:

Двигаемся дальше к поклаже Красной Шапочки:

«Иду я к бабуле, гостинцы несу:
Щепоточку риса, женьшень и кинзу,
Котлеты домашние и колбасу
».

Необходимо нарисовать сразу пять предметов. Я пробовал, не получилось. Вернемся опять к картам и будем показывать картинки поочередно, а чтоб не тратить драгоценные попытки в Midjourney, воспользуемся сервисом Dream by WOMBO. Это бесплатно, практически без ограничений (в бесплатной версии недоступны некоторые стили и одновременно генерится не четыре картинки, а одна). Сходите, попробуйте: https://dream.ai/create .

Мне пришлось изрядно намучиться с колбасой. Это не колбаса, это сосиски какие-то (правда, реалистичные), даже показывать не стану, а когда я попросил нарисовать толстую вареную колбасу, ИИ стал предлагать такое:

(У меня есть подозрение, что в английском существует какой-то близкий аналог нашему идиоматическому выражению «деловая колбаса», в котором используется упоминание мясного продукта.)

И тем не менее после нескольких десятков попыток у меня сформировался окончательный вид поклажи:

Котлеты получились не очень убедительными, а колбаски все-таки тонковаты.

Впоследствии нунчаки, топор и косу тоже рисовал в Dream by WOMBO.

Больше ничего заслуживающего внимания не происходило, просто генерация новых запросов и отбор рисунков для иллюстрации песни. Разве что с самураями: как только я просил нарисовать их непременно пьяными (Seven drunken samurai stand in a summer forest), Midjourney использовала желто-коричневые тона и часто ошибалась в количестве мужчин в кадре:

С трезвыми самураями все было в порядке и рисунки были покрасочнее.

В лучших традициях олдов включил пасхалку в один из кадров — где-то на 90 секунде.

Вот и все. Спасибо всем, кто дочитал, а тем кто еще и видео посмотрел, двойное спасибо! :)

Показать полностью 14
9

Midjourney готовятся выпустить новую версию движка V5 уже на этой неделе!

Midjourney сегодня объявили, что готовятся выпустить новую версию движка V5, уже на этой неделе!

Предыдущая версия программы (V4) стала заметным улучшением по сравнению с V3. Сейчас они работают над релизом пятой версии, которая как обещают, станет еще лучше!

Команда в настоящее время проводит тестирование нового алгоритма и собирает обратную связь по созданным с его помощью изображениям.

В разработке новой версии Midjourney (v5) заменили каждый компонент на более совершенный. Они обещают, что новая версия будет более детализированной и реалистичной, с лучшей реализацией моделей и рук. (Дождались)

Изображения, созданные с помощью v5, имеют более высокое разрешение по умолчанию (1024 x 1024) и могут отображать более широкий диапазон стилей. Особенно это заметно в фотореалистичных изображениях, которые демонстрируют более высокий уровень детализации и точности.

Источник: Midjourney Prompts

Показать полностью 2
Отличная работа, все прочитано!