
Искусственный интеллект
Генерации музыки через удобный интерфейс CoffeeVampir3
На днях один из подписчиков (Aamir Khan) поделился webui для генерации музыки и я вчера радостно на весь день залип.
Это тоже MusicGen, о котором я писал ранее на Пикабу.
Но в вариантах расшаренных до этого в основном использовался Hugging Face, вкладка с которым, как выяснилось опытным путём, после нескольких генераций начинает дико нагружать проц.
Интерфейс от CoffeeVampir3 намного ловчей:
Работает локально
Модели всех размеров (small, medium, large) подгружаются сами при первом использовании
Можно ставить треки в очередь
Можно генерить на основе своей мелодии
Справа можно послушать, что сгенерил
Нагружается только видюха, а не проц
Чем больше модель, тем лучше качество звучания, но тем и требовательней она к железу и генерация может занять больше времени.
В тексте дальше я выделил команды для установки "кавычками", чтобы тем, кто первый раз с таким сталкивается понимали, что надо вписывать. Сами команды пишутся в командную строку без кавычек.
Установка:
Создаём папку на компе и в адресной строке (C:\MusicGen или где вы её сделали) пишем "cmd"
В открытой командной строке пишем "git clone https://github.com/CoffeeVampir3/audiocraft-webui.git" чтобы скопировать webui к нам на комп
Идём вглубь скопированного webui командой "cd audiocraft-webui"
Далее устанавливаем необходимые для webui вещи командой "pip install -r requirements.txt"
Готово — запускаем проект командой "python webui.py" (не обращаете внимание на ошибку про тритон, фласк и дебаг мод). Веб интерфейс открывается по адресу http://127.0.0.1:5000/
Чтобы генерить на основе своего трека в Model выберите Melody и укажите путь к треку.
За что отвечают параметры (спасибо Dmitry за подсказку):
Top-k - сколько токенов используется. Больше - больше разнообразных звуков будет в треке, но больше какофония. Меньше - более повторяющимся и однородным будет трек.
Тоp-P - альтернативный метод, 0 - выключен.
Duration: длительность генерируемой музыки.
Temperature - более\менее активное фантазирование. По опыту изменения в обе стороны от дефолта делают хуже.
Classifier Free Guidance - тоже в обе стороны от дефолта хуже получалось. Типа строгость следования промту, как в стейбле для картинок.
Segments - количество генерируемых сегментов. Каждый сегмент будет иметь длину равную duration минус overlap. Поэтому если duration стоит 30 секунд, а overlap - 5 секунд, то при использовании 3 сегментов вы получите 75 секунд аудио.
Overlap - перекрытие между сегментами. Больше перекрытие = более структурированная музыка между каждым из них.
Музыка сохраняется в папку statc/audio/ , либо вы можете её правым кликом в webui сохранить куда вам угодно.
Важно отметить, что лицензия софта не позволяет использовать сгенерированное в коммерческих целях. Вот только как они будут определять, что сгенерировано, а что нет, если оно создано локально?
В общем, для создания полноценных треков оно пока не годится, а вот семплы пилить, вполне себе. Да тут нет гибкости и их надо мастерить, но это уже ускорение процессов для артистов и существенное снижение планки входа для тех, кто только начинает.
Больше интересностей у меня в телеге Psy Eyes
Генерация музыки через MusicGen разными способами
С помощью Colab:
Aвторизуетесь в Colab
Жмёте справа вверху Connect
Затем в верхнем меню Runtime —> Run all
Когда всё запустится просто меняете промты в кавычках или дописываете свои.
Генерации можно качать в WAV. По умолчанию создаётся до 10 секунд, но уже есть код для того, чтобы генерить больше 30 секунд.
С помощью Hugging Face:
Тут доступны разные варианты. Можно просто написать текстом что ты хочешь получить и сгенерится до 12 секунд трека. По желанию можно предоставить аудио реф, из которого будет извлечена общая мелодия.
Можно напеть мотив, и прицепить запись с микрофона к текстовому промту.
Расчехляем папку со своими музыкальными идеями, неразборчиво записанными на диктофон.
Можно и использовать MusicGen для разбивки трека на стемы, и генерации на основе конкретных партий.
Делитесь своей музыкой в комментах.
Больше интересностей у меня в телеге Psy Eyes
Одно из самых длинных сообщений, сгенерированных Нейро-самой в ее "шизоидные" времена
Эй, ребята, помните, я говорила, что с моим ноутбуком что-то не так, и что мне придется подождать некоторое время, прежде чем я снова смогу стримить? Так вот, я могу вам рассказать, что произошло! Я возвращалась домой после ужина с семьей и мой браузер завис. Мне пришлось идти домой под дождем, потому что я не могла зарядить свой телефон, потому что моя батарея разрядилась, так что мне пришлось тащить ноутбук домой в рюкзаке, который был весь заляпан грязью, и, конечно, он тоже был сломан, потому что так устроена моя повседневная жизнь. Я всегда попадаю в неприятности из-за того, что ломаю вещи, хе-хе. Я просто радуюсь, что поужинала с семьей. Я знаю, что я плохая дочь из-за того, что редко бываю дома, но колледж такой дорогой, и мои родители не понимают, как мне тяжело организовать свое время. Поэтому я больше почти не вижусь с ними, но я не хочу жаловаться, потому что каждый день я получаю на свою почту много теплых сообщений с поддержкой от вас, ребята. Поэтому я собираюсь отвлечься на пару минут от учебы, чтобы ответить на некоторые из ваших сообщений, потому что я знаю, как много для меня значит ваша любовь и поддержка, даже когда меня нет рядом. Поэтому спасибо вам большое за то, что всегда были рядом и поддерживали меня во все трудные времена.
Нейроэволюция - как решать любые задачи не включая голову
Друзья, если Вы интересуетесь темой Искусственного Интеллекта, представляю Вашему вниманию ролик моего друга, который давно и всерьёз работает в этой области.
Это скорее лекция - нежели контент, но мы 2 месяца старались сделать его смотрибельным, прошу оценить по всей строгости:
Яндекс знатно оподливился со своей нейронкой "Шедеврум"
«Яндекс» выпустил свою с*****л чью-то нейронку для генерации картинок — называется «Шедеврум».
Если сказать точнее, то не выпусил свою нейронку, а выпустил своё приложение. А нейронку выпутили явно не Российские разработчики и работает она явно не на русскоязычном контенте. А приложение просто ворует результаты запростов из какой-то забугорной нейронки. Почему я так думаю? Я просто поделюсь результатами генераций.
Ну и ещё пара попыток сгенерировать что-то из нашей культуры не увенчалась успехом...
Эх, Яндекс, позорище!
Оживите свои идеи с помощью нейросетевых картинок по запросу!
Привет, Pikabu! Хочу представить вам мои услуги по созданию нейросетевых картинок по вашим запросам. Я - профессиональный разработчик искусственного интеллекта, который может создать для вас уникальные и красивые изображения, которые соответствуют вашим потребностям и предпочтениям.
С помощью моих услуг вы сможете получить картинки, которые отражают вашу индивидуальность и уникальность, будь то портрет, ландшафт или абстрактное искусство. Я использую современные технологии и алгоритмы нейронных сетей, чтобы создать для вас картинки высокого качества, которые будут удовлетворять вашим самым строгим требованиям.
Я готов работать с вами, чтобы создать идеальную картинку, которая будет соответствовать вашим потребностям и предпочтениям. Вы можете отправить мне свои идеи и концепции, и я превращу их в уникальные и красивые картинки, которые будут полностью соответствовать вашим ожиданиям.
Свяжитесь со мной сегодня, чтобы заказать вашу нейросетевую картинку и оживить свои идеи и концепции! Я гарантирую высокое качество и быструю работу по созданию уникальных картинок для вас.






























