
Искусственный интеллект
Генерируем себя или персонажа в различных позах
Попробую в цикле из нескольких постов расписать, как можно использовать разные генеративные инструменты . Где-то среди предложенных мной платформ есть лимиты, и ограничения, но в рамках ознакомления и выполнения небольших задач, подходят на ура.
https://replicate.com/fofr/consistent-character — штука полезная, если хотим своего сгенерированного персонажа, или даже фотографию попробовать изобразить в разных позициях/ситуациях.
Как пользоваться? В поле Subject грузим файл исходника, в Promt кидаем подробное описание в т.ч. с деталями нашего персонажа, чтобы получить на выходе нечто интересное.
Я попробовал сделать со своими сгенерированными персонажами, получилось неидеально, но (!), мы можем брать за основу нашего персонажа, и брать с ним разные генерации и использовать их например для создания AI-блогера. Т.к. они будут отличаться от исходника, то исходник можно использовать просто как основу, а на площадках уже выкладывать непосредственно генерации из consistent-character.
https://huggingface.co/spaces/fffiloni/consistent-character — на платформе Hugging Face данная модель также представлена, она немного в упрощенном виде, для примера показал на скрине, как с помощью простой подсказки (промта) переодел персонажа Генри Кавилла из сериала Ведьмак в костюмчик.
На скриншоте представлен кстати отличный пример использования, мы загружаем только анфас персонажа, а в промт пишем в каком амплуа хотим увидеть и получаем неплохой результат.
Где можно применять?
Геймдев, дизайн, блогинг. Формально, у вас инструмент, где вы можете работать с одним персонажем и использовать его как угодно, хоть в стикерпаках, хоть на страницах аккаунта.
Взято из канала Верю только трендам. Там пишу больше о Digital, ИИ и маркетинге. Рассказываю как применять инструменты ИИ платные и бесплатные в работе. Буду рад видеть.
Какие существуют модели Stable Diffusion
Сегодня среда, а значит мы с Вами разбираем техническую составляющую нейросетей или узнаем, как можно запустить ту или иную программу.
Сегодня на разборе, как я недавно обещал, Stable Diffusion.
Для начала быстро пробежимся по его версиям:
🔤Stable Diffusion 1.5. - именно эта модель принесла популярность компании. Она самая нетребовательная по железу и на нее создано очень много кастомных обновлений.
🔤 Stable Diffusion 2.1. - не очень популярная версия. Хоть работает и лучше, чем предыдущая, но тут добавили цензуру, поэтому она не встретила популярности.
🔤 Stable Diffusion XL. Вышла летом 2023 года. Генерирует в разрешении 1024 × 1024, создает текст, лучше работает с композицией. На ее основе появилось много пользовательских моделей. И по сей день является, наверно, самой популярной из версий.
🔤 Stable Cascade. Вышла в феврале 2024 года. Работает хорошо, но только по подписке.
🔤 Stable Diffusion 3 - есть "голая" версия тройки, а есть недавно вышедшая Medium, которая вообще не должна была выходить и была неудачным экспериментом. Но руководство компании настояло на том, чтобы выпустили даже то, что вышло, и вышло не очень.
Про сайты, где им можно воспользоваться, расскажу чуть позже. Или уже завтра.
На нашем телеграм канале Эксперт рассказывает подробно о популярных и не очень нейросетях. Об их пользе, как использовать, бесплатные версии, а так же как с их помощью зарабатывать. Переходи по ссылке и присоединяйся к сообществу экспертов - https://t.me/PROAI_exp
ИИ-генератор говорящей головы
Elevenlabs научился создавать любые звуки для видео
Работает предельно просто: скидываем свой ролик без звука, а нейросеть анализирует его, сама подбирает подходящие аудиоэффекты и выкатывает вам целую пачку. При чем звуки могут быть какими угодно: игра на гитаре, ядерный взрыв, битое стекло, разговор в компании и т.д. Всё это бесплатно и доступно прямо в браузере. Бежим тестить.
Источник телеграм-канал NEUROHUB🔥👈 Ещё больше нейроконтента
Более 500 полезных промтов для ChatGPT и других LLM
На сайте собраны промты для ChatGPT, которыми абсолютно бесплатно можно будет воспользоваться по своему усмотрению. Эти текстовые подсказки спокойно можно использовать и для других языковых моделей.
На сайте предусмотрена разбивка по категориям с подробным описанием, а заодно и удобная навигация, так что не потеряетесь 😉
Хороший способ бустануть свою продуктивность без всяких кайдзенов, випасан, биохакингов и прочих заумных слов, напечатав которые я уже устал 😥
Источник 🍳 - больше о технологиях и полезных сервисах
Ну что, сравним новинку от Runway с великой и могучей, но по-прежнему недоступной Sora?
Источник телеграм-канал NEUROHUB🔥👈 Ещё больше нейроконтента
GEN-3 от RunWay нейросеть для создания видео
В мире цифровых технологий произошла настоящая революция в создании видео и изображений благодаря новейшей нейросети GEN-3, разработанной компанией Runway. Этот передовой инструмент обещает изменить подход к визуальному творчеству, предоставляя пользователям невероятные возможности. В этой статье мы рассмотрим особенности GEN-3, его функции и то, как он может помочь творческим профессионалам поднять свою работу на новый уровень.
Что такое GEN-3?
GEN-3 - это новейшая нейросеть, разработанная междисциплинарной командой исследователей, инженеров и художников из компании Runway. Она представляет собой результат коллаборации между искусственным интеллектом и человеческим творчеством. Обучение нейросети было направлено на интерпретацию и создание широкого спектра стилей, а также на понимание кинематографической терминологии.
Ключевые особенности GEN-3
Одна из главных особенностей GEN-3 - это ее способность к адаптации и интерпретации. Нейросеть может создавать контент на основе текстового или визуального ввода, интерпретируя его через призму различных стилей и эстетик.
1. Инструменты для работы с видео и изображениями
Новые инструменты Runway, интегрированные с GEN-3, включают "Текст в видео", "Изображение в видео" и "Текст в изображение". Эти функции позволяют пользователям создавать динамичный контент, детально контролируя структуру, стиль и движение. Теперь вы можете описать сцену или действие текстом, и нейросеть создаст соответствующее видео или изображение.
2. Режимы для творческого контроля
GEN-3 предлагает расширенные режимы, такие как "Кисть движения", "Расширенные элементы управления камерой" и "Режим режиссера". Эти функции дают пользователям возможность тонко настраивать движения камеры, добавлять динамичные эффекты и создавать по-настоящему кинематографические сцены. "Кисть движения" позволяет рисовать траектории движения для объектов, обеспечивая плавные и естественные анимации.
3. Выразительные персонажи
Особое внимание уделено созданию выразительных и реалистичных человеческих персонажей. GEN-3 может анимировать широкий спектр действий, жестов и эмоций, что делает персонажей более живыми и привлекательными. Нейросеть способна интерпретировать и воссоздавать сложные эмоции, делая персонажей более убедительными.
4. Кастомизация моделей
Функции кастомизации моделей GEN-3 позволяют пользователям создавать уникальных персонажей, соответствующих их творческому видению. Вы можете настроить внешний вид, стиль и даже движения персонажей, делая их более стилистически контролируемыми и последовательными. Это идеально подходит для создания узнаваемых героев или соответствия конкретным художественным требованиям.
Применение GEN-3
Runway GEN-3 может быть использован в различных областях, включая кино, анимацию, рекламу, создание контента для социальных сетей и многое другое. Он идеально подходит для творческих профессионалов, стремящихся расширить свои возможности, а также для энтузиастов, желающих попробовать что-то новое.
Runway GEN-3 представляет собой мощный инструмент, который обещает революцию в создании цифрового контента. Сочетая передовые технологии нейросетей с творческим видением пользователей, он открывает безграничные возможности для визуального повествования. Художники, режиссеры, аниматоры и энтузиасты теперь могут создавать по-настоящему впечатляющий контент, не ограничивая свою фантазию. GEN-3 - это шаг вперед в мире цифрового творчества, и мы с нетерпением ждем, чтобы увидеть, что создаст сообщество с помощью этого удивительного инструмента.
Генератор речи с открытым исходным кодом
Camb AI выпустили Mars5 — ИИ, который передает нюансы речи и эмоции лучше, чем ElevenLabs (по крайней мере, так заявляют разработчики). С компанией уже сотрудничают футбольная лига MLS и киностудии. В будущем планируют выпустить модель для перевода речи, которая будет работать в паре с Mars5.
Источник телеграм-канал NEUROHUB🔥👈 Ещё больше нейроконтента



