Сообщество - Искусственный интеллект

Искусственный интеллект

5 077 постов 11 491 подписчик

Популярные теги в сообществе:

2

ИИ инструмент от Contra, сделает совершенное портфолио за пару минут!

Этот инновационный инструмент создает персонализированный профиль, основываясь на ваших ответах. Выберите должность, навыки, город и описание, и получите готовое портфолио. Все ваши кейсы можно легко перенести в новое портфолио одним кликом. Кроме того, вы сможете изучать аналитику, получать выплаты и хранить контракты прямо в вашем портфолио.


Попробовать — тут.


Источник мой Телеграм паблик: https://t.me/thefutureidol

Показать полностью
32

SadTalker - Делаем LipSync в видео и оживляем изображения при помощи нейросети

SadTalker - нейросеть от китайских разработчиков, изначально предназначенная для анимации лиц на различных изображениях - от артов до фотографий. Ознакомиться с проектом подробнее можно на их GitHub

SadTalker VideoLip - это форк SadTalker, предназначенный для синхронизации движения губ на видео с аудиодорожкой. Исходный код проекта: GitHub

Обе программы работают на видеокартах от Nvidia и CPU. Но на CPU обработка может занять несколько часов.

Сегодня поговорим о портативных версиях обеих программ, которые я подготовил для вас.

Видеообзор и примеры готовых видео можно посмотреть на YouTube.

SadTalker

Интерфейс простой (представлен выше) и содержит следующие элементы:

  • Поле загрузки изображения

  • Поле загрузки аудио

    Настройки:

  • Стиль позы: вариации анимации лица

  • Разрешение лица - чем больше, тем лучше итоговое качество. Увеличивает потребление видеопамяти

  • Предобработка влияет на то, в каком формате будет итоговое видео. Кроп - обрезает лицо до квадрата. Full оставляет видео таким каким вы его загрузили. При использовании Full крайне рекомендуется использовать "Режим неподвижного изображения"

  • Размер пакета (Batch Size) влияет на скорость обработки: выше - лучше - больше видеопамяти потребляется

  • GFPGAN улучшает качество лица на выходе.

    Итоговые файлы сохраняются в папке results.

Интерфейс тоже достаточно прост. Он состоит из следующих элементов:

  • Поле загрузки видео

  • Поле загрузки аудио

  • Выбор режима улучшения (опционально). Можно улучшить качество губ или качество лица, но влияет на потребление видеопамяти и скорость обработки.

  • Batch Size. В теории - чем выше значение тем лучше, надо выбирать целые числа. Но по факту, чем больше - тем сильнее потребление памяти, а прироста скорости я особо не заметил.

  • DAIN - экспериментальная и нестабильная функция. Призван улучшить качество липсинка, путем дорисовки кадров.

После конца обработки, результат будет сохранен в папку results внутри папки с программой. Вам нужен будет файл, который заканчивается на full.

Как обычно, я подготовил портативные версии с запуском в 1 клик. Вам надо лишь скачать архив, распаковать и запустить bat файл с названием start.

Скачать их можно тут:

Яндекс Диск

Будущие обновления, а также другие портативные сборки различных нейронок можно найти в моем Телеграм канале.

Ну, а задать вопросы можно в нашем чате.

Показать полностью 2
2066

Чтобы контролировать ракурсы в Midjourney, достаточно добавить в запрос информацию о желаемом угле камеры

Чтобы контролировать ракурсы в Midjourney, достаточно добавить в запрос информацию о желаемом угле камеры

Сохраняйте подсказку:

Wide Angle — Широкий угол

Close-up — Крупный план

Diagonal Angle — Диагональный ракурс

Aerial — Снимок с воздуха

High Angle — Снимок сверху

Low Angle — Снимок снизу

Macro — Макро

Oblique Angle — Снимок под наклоном

Источник мой Телеграм паблик: https://t.me/thefutureidol

Показать полностью 1

Вопрос к нейроэниузиастам

Всем чудесных воздухов и гладких дорог, уважаемые. Я наткнулся на надо очень своебрасных хаотичных, но связанных с собой роликов, отнснятых ещё в школе и меня отпускает одна идея.
еРеализовано ли на данный момент нечто такого продукта как автомонтажёр.
Чтобы сскинуть ему весь этот разрозненный поток сознания, даже наши дорогие коллеги машины с мозгов али из этого чмонтироввное видео?
Еслитнеь, мможет соберёмся да сделаем ?

ИИ создает кино

Новым короткометражный фильм созданный при помощи ИИ "WATCH OUT!".

Будущее кинематографа уже здесь.

Создано при помощи: runwayml

Показать полностью
6

Генерация MIDI в Ableton по тексту

Генерация MIDI в Ableton по тексту

Чуваки из KORUS делают плагин для Ableton, чтобы генерить MIDI по описанию. Вписаться потестить можно тут (получите доступ - делитесь).

Осталось скормить папку со своими неразборчивыми напеваниями с диктофона для получения MIDI, промтом задать стиль звучания, а дальше ручками — навык никто не отменял.

А там и до нейро-компьютерных интерфейсов недалеко.

Больше интересностей у меня в телеге Psy Eyes

Показать полностью 1
247

Руссифицировал трейлер Cyberpunk 2077: Phantom Liberty Trailer (русский дубляж) Russian voices голосами оригинальных актеров

Потратил 10 часов и время фермы в 40GPU для создания русской озвучки трейлера к дополнению Phantom Liberty. Треллер вышел на английском языке озвученный реальным актерами такими как Идрисс Эльба (других я тупо не знаю). Собственно голоса в русской версии именно оригинальных актеров всех тех, что были в трейлере, которые само собой по русски ни разу в реальной жизни не говорили. Для того, что бы заставить говорить Идриса на русском хватило его монологов из трейлера, остальные голоса тоже брались из ролика. Особенно крутым фактом считаю, что образцов голоса презинента всего 6 секунд из всего ролика и даже этого хватило для обучения нейросети. Так же нейросеть не тупо озвучивает субтитры в отрыве от контекста, до этого ей был скормлен весь контекст ролика со всеми диалогами именно по этому она понимает где какие интонации нужно применить и где какие эмоции, то есть кто с кем общается и как это нужно произнести. Собственно предлагаю ознакомиться с результатом:

6

Потоптать кнопки за развитие машинного интеллекта (МИ) и куда и как это нас заведет

Раз уж на пикабу минусы отключили напишу тут текст про «что я думаю нас ждет с развитием МИ». Отвечая на любимый вопрос комментаторов «автор и что ты хотел сказать/зачем ты это написал» - просто так, не читайте.

То, что есть сейчас в сфере «искусственного интеллекта» - ChatGPT, Midjourney и все такое - это т.н. слабый МИ. Т.е. модель заточенная под получение конкретных ответов для каких-то стандартных наборов входных данных. По факту очень большая матрица (точнее связанные матрицы) весовых коэффициентов. Не подумайте, что сравнение с матрицей как-то принижает слабый МИ. Если верить биологам мозг в общем-то устроен похоже только на биологической, а не кремниевой платформе. Ну и посложнее конечно же.

Что принципиально нового произошло последние пару лет. Слабый МИ развился до состояния, когда самый простой пользователь может извлечь из него понятную пользу. И это стало бизнесом. Отсюда следует, что теперь МИ останется с нами навсегда и будет развиваться. Если текущие представления ученых об окружающем мире верны и нет никаких скрытых видов излучения или аур/души или не знаю, чего еще, которые позволяют нам мыслить, то через какое-то время МИ станет способен «думать» и «вести себя» т.е. приобретет волю и еще через какое-то время обгонит в этой способности человека. Скорее всего на этом известная нам история человечества закончится, начнется ли в этом месте фильм Терминатор не понятно, может быть, и нет. Но точно ход вещей изменится. Разве что сработает шанс в 1% и МИ решит управлять нами тайно, не привлекая внимания широкой общественности. Что будет после точки ноль не понятно т.к. многое зависит от того как именно мы в нее придем.

Какие тут я вижу варианты. Конечно, возможно для построения сильного МИ достаточно просто гениальной идеи – «вот так сейчас куски кода соединим и здравствуй Владыка!». Но учитывая, что разные компании этим занимаются уже лет так 10 минимум, скорее всего секретной комбинации блоков не существуют и нас ждет долгий путь.

Сейчас разные нейросетки бодро умеют решать узкие специализированные задачи. Можно ожидать развития в этом направлении в сторону качества решения задач, универсальности, модульности и комбинации сетей для решения каких-то сложных проблем. Скажем одна моделька в мозгу дрона смотрит вниз и ищет плохих людей, вторая управляет пулеметом, третья решает куда лететь, так сказать, стратегически, четвертая корректирует курс уворачиваясь от разнообразных летящих в сторону дрона предметов. И да, такая штука уже описана у Пелевина.

Я думаю, такое развитие породит не один супер разумный МИ, а много немножечко умных МИ, каждый из будет очень круто, круче человека делать какую-то отдельную задачу. Скорее всего эта штука будет как-то развиваться, укрупняться, но все еще долго не будет прям вот полноценным сильным МИ. Т.е. будет например электронный юрист который будет боро принимать заявки от клиента, анализировать документы, давать советы, подавать документы в суд и обрабатывать запросы разных сторон, но этот полу-сильный МИ все еще не будет способен скажем вести исследования в области неорганической химии (или выводить новые породы людей-киборгов на космической станции).

Сколько такое продлится? Учитывая общую динамику развития софта, я думаю не менее лет 10-и. Что будет дальше не понятно, скорее всего к тому времени уже появятся реально работающие инструменты, ускоряющие создание программ. С другой стороны развитие процесса софта последние годы стабильно идет в сторону утяжеления процесса разработки, так что ускорения может и не случится. Справимся ли мы за скажем 50 лет? Я думаю да, это прям дохрена. Справимся ли за 20 лет? Не знаю, может быть. Скорее всего там не будет прям «точки ноль». Будет какое-то количество полу-универсальных МИ которые будут вот прям очень близко, но все еще не новой формой сознания.

Скорее всего четкой границы тут и нет. Предположим, у нас есть МИ, сознание и воля которого сопоставимы с сознанием и волей необразованного 65-и алкоголика из деревни Зажоповка. Стоит ли признать такой МИ разумным? Это прям не простой вопрос, формально то да, а вот не формально – тут открывается прям бездна в виде вопроса – можно ли признать разумным того или иного человека. Видимо будет какой-то серый переходный период в несколько лет, когда ответ на это вопрос будет скажем так уточняться, но потом МИ перегонит по развитию самих уточнятелей и вопрос отпадет сам собой.

Что тут хорошо – «сознание» МИ скорее всего будет не идентично человеческому и подход к решению проблем будет другим. Так что не факт, что МИ решит убить всех человеков. Все же массово убивать людей это прерогатива самих людей, больше никто кроме нас самих в этом замечен не был.

Что именно МИ про нас решит – большой вопрос – но видимо будет вытеснение людей из отдельных сфер и отмирание каких-то сфер где людей больше нет, а никому кроме человека они не нужны. Скажем если грузовые суда станут полностью автоматическими, то вся сфера вокруг логистики моряков, подбора кадров, сертификации и т.п. станет просто не нужной. И так будет постепенно начиная с мозговой деятельности. Те кто работает мышцами потеряют работу в последнюю очередь. Организм человека — это очень крутая платформа чтобы что-то такое делать физическое. Особенно что-то нестандартное. Скажем искать и фиксить обрыв кабеля ведущего в датацентр или монтировать блоки системы охлаждения дата центра.

Как оно скорее всего будет происходить. Вот ты такой работаешь скажем старшим специалистом логистической фирмы, умеешь делать много сложных трюков со своевременной поставкой контейнеров с памперсами ритейлеру. И вдруг бац – ты больше не нужен, вместо тебя МИ который это умеет делать не хуже, а то и лучше. Первое время будет МИ + один (ну ладно два для заменяемости) специалиста которые страхуют и решают совсем уж не тривиальные вопросы. А потом с какого-то момента и их уволят. И вообще больше на планете Земля специалисты такого профиля не нужны вообще. "Продавцом в магазин идите"(с). Ой точнее нет т.к. продавца тоже не так уж сложно заменить, так что карьерная линейка продавца на этой планете закрыта навсегда.

Сильнее всех достанется ИТ-шниками я думаю – их сейчас много, они неплохо живут и в ИТ дофига легко формализуемых задач. Всех сразу не уволят, последние 0.01% я думаю и при самом сильном МИ будут востребованы, а вот куча рутинных и простых должностей отпадет достаточно быстро. Начало массового процесса мы увидим на горизонте лет так в 5-10 не больше. Возможно, какие-то ниши где нужно много человеческого здравого смысла будут существовать очень долго, возможно это будет что-то неожиданное, например manual QA. Синьерный код и авто тесты будет писать МИ, а проверять и поправлять его будут manual QA.

В какой-то момент нас накроет прям вообще по-взрослому. Под накроет я понимаю не "машины всех убьют", а слом стандартного беличьего колеса человеческого счастья «обучение – развитие карьера – дети – накопление ништяков/их защита – передача ништяков детям». Этот цикл двигал нас вперед долгие десятки тысяч лет. Что будет если отсюда вынуть карьеру/развитие и владение ништяками, я не знаю. И как мне кажется такой штуки как деньги в привычном нам виде и владение имуществом в ситуации, когда планетой рулит МИ уже не будет. Я скорее всего этого не увижу, а вот дети уже имеют вполне хороший шанс посмотреть на начало всего этого и найти ответ на вопрос – можно ли будет при МИ сидеть на берегу моря и пить пиво, пока МИ всем заправляет или нужно будет жить в контейнере на минус 10-ом уровне и крутить гайки в технических коридорах, и то только потому что хороший робот для кручения гаек собирать долго, а люди бесплатные.

Показать полностью
Отличная работа, все прочитано!