
Искусственный интеллект
ИИ генерит мелодию
ИИ нагенерит вам мелодию по одному короткому запросу! OpenMusic умеет в любые стили — и делает это бесплатно:
• Нет ограничений
• Нет платных подписок
• Крайне простой интерфейс с двумя кнопками
• ИИ способен понять любой промпт
• Генерация занимает пару минут.
Ссылка тут.
Код на GitHub — тут.
Нейронка клонирует голос
Нейронка клонирует ваш голос за ШЕСТЬ СЕКУНД и переведет на 17 разных языков. Становимся полиглотом прямо сейчас:
Отчёт a16z - что сейчас действительно горячо в мире искусственного интеллекта:
1. Креатив правит балом: 52% топовых приложений занимаются созданием контента. Luma и Viggle ворвались в топ-20, показывая, что новички тоже могут.
2. Видео и музыка наступают: Забудьте о статичных картинках! Теперь ИИ генерирует видео и музыку. Suno, например, взлетел с 36-го на 5-е место.
3. Битва ассистентов: ChatGPT все еще король, но Perplexity и Claude дышат ему в затылок. Причем Perplexity даже обгоняет лидера по времени, которое пользователи проводят в приложении.
4. Китайское вторжение: Bytedance (создатели TikTok) запустили сразу шесть новых приложений в топ-100.
5. Красота по алгоритму: LooksMax AI и Umax не просто улучшают ваши фото. Они анализируют ваш голос и показывают, как бы вы выглядели, будь вы идеальны. 2 миллиона пользователей уже играют в эту игру "стань красавчиком".
Что все это значит? ИИ не просто помогает нам – он становится нашим креативным партнером, стилистом и даже музой.
Как сервис распознавания речи и транскрибации Any2text расшифровал сюжет из «Что? Где? Когда?» и видео из TikTok: подробный тест
Продолжаем расшифровывать всё и вся в поисках лучшего решения. Всё-таки помощников в этих делах для авторов, редакторов да и простых пользователей — много не бывает. Сегодня тестируем Any2text, сервис для распознавания речи и транскрибации в пару кликов.
Первое впечатление
С первого взгляда — интерфейс понятный и простой, без визуального шума. Да и вообще, чем проще оформление в таких инструментах, тем эффективнее и приятнее работается. Также я сразу обратил внимание, на то, что у сервиса подписка «по объёму», а не «по времени использования». Это занятное УТП, я такого не видел у конкурентов.
Не буду тут сильно распыляться и рассказывать, как именно такие сервисы упрощают работу, рутину и повседневность. Вы и сами, наверное, понимаете. Они, как секретари, помощники и ассистенты — разбирают нудные задачки, оставляя нам, человекам, самый сок.
Например, в бизнесе, в отделе контента или пиара — у спецов много однотипных функций. Приходится всё время с кем-то общаться, что-то искать, обрабатывать, проверять, компоновать, сокращать.
Бесконечные планёрки, созвоны, интервью. И вот для всего этого, чтобы лишний раз не лезть на стену — я и тестирую сервисы вроде Any2text, который уже производит приятное впечатление.
Что по ценам?
По стандарту есть два варианта использования сервиса — бесплатно и без регистрации (но с ограничениями) или же с регистрацией и приятным бонусом.
Без регистрации даётся 15 минут для первого ознакомления, а после короткой анкеты к этим 15 минутам добавят ещё час. Бонус крутой, это правда.
Тарифы слегка выше, чем у сервисов, которые я тестировал ранее, но там буквально копейки, так что несущественно. Жирный плюс в том, что подписка на сервис основывается на объёме — кроет любые неудобства.
То есть, можно единоразово оплатить подписку на 1000 минут и пользоваться всеми благами в течение года, не сожалея о неиспользованных минутах в подписке на месяц.
А ещё можно получить скидку в 20% за приглашённого друга. Такая партнёрка выглядит максимально дружелюбно и в ней реально можно поучаствовать для дела.
Что по заявленным функциям?
Основные плюшки Any2text:
Быстрый перевод аудио в текст
Чёткий перевод видео в текст
Автоопределение и распознавание более 50 языков
Неограниченный хронометраж видео и аудио для преобразования
Большое разнообразие форматов
Что же, давайте пробовать.
Обещанное видео
Итак, я решил сразу дать сервису задание, так сказать, повышенной сложности — расшифровать небольшое видео из интеллектуальной игры «Что? Где? Когда?». Сами понимаете, там крики, шум, куча голосов.
Но, прежде чем оценивать результат, хочу показать, как выглядит «внутрянка» сервиса.
И отметить классный UX — пока ждёшь расшифровку, вместо «Идёт загрузка», тебя подбадривают и веселят какой-нибудь милой фразой, которая ещё и меняется каждый раз. Что-то вроде комплимента от шефа, выглядит круто.
А вот и сам результат расшифровки нашего видео. С первого взгляда кажется, что текст немного сумбурный. Но если глянуть исходник, вы увидите, насколько хорошо сработал сервис. Помехи (фоновый шум, спутанная речь, перекрикивания) действительно могут сильно мешать алгоритмам, но не в этом случае.
Сложно даже представить, сколько бы ушло времени на ручную расшифровку такого формата...
Также я решил попробовать расшифровать видео из TikTok на тему «Признаки, что ваша кошка балуется». Почему бы и нет. Этот формат я, вообще, никогда не тестировал, так что любопытно.
Текст расшифровался за пару секунд: быстрее быстрого. Единственное, он не разбит на абзацы. Но думаю, это связано с тем, что ролик короткий, на одну тему, а текст читает единственный "спикер".
На десерт — выступление из TED на английском языке. Тоже пригодная расшифровка + заняла секунд 15. Грамматика и пунктуация на твёрдую пятёрку. Правда и здесь текст не разбит на абзацы, но это не так страшно.
Не обещанное, но аудио
Ну, и как же не потестить аудио, если дают? Тут две дорожки, на русском и на итальянском языках, для разнообразия.
Пока думал, какие материалы взять для теста, пришёл к мысли, что такие сервисы очень выручают людей с повышенными потребностями, например, слабовидящих. У них, вероятно, не всегда есть возможность записать свои мысли в документ или использовать голосовой ввод. Так что кому-то плюсик в карму.
К слову, в Any2text действительно не ограничивают длину аудио для расшифровки. Сам интерфейс простой и удобный, а все надписи — довольно крупным шрифтом. Ещё порадовало отсутствие всплывающих окошек и анимации, которая может сбить с толку. Короче, чувствуется, что делают сервис для людей.
Ну да ладно, продолжим с аудио. Мне, как писателю и журналисту — часто нужно куда-то деть свои мысли, идеи и наработки. И может быть полезно в моменте записать аудио вместо тысячи слов.
Так что здесь я попробовал расшифровать целый рассказ, на пробу. Вышло классно, все знаки на месте.
И тихо-медленно-быстро переходим к сказке на итальянском языке. Я взял небольшой кусочек из «Алисы в стране чудес». На всякий случай, проверил расшифровку через переводчик (всё чётко). Ну, и здесь уже текст поделён на абзацы, поэтому читать одно удовольствие.
В заключение
Итак, я однозначно положу в свою невидимую копилку этот инструментик.
Что понравилось?
Простой, как три рубля, интерфейс сервиса
Разумная подписка с оплатой за объём — для тех, кто нечасто сталкивается с расшифровкой
Предельно быстрая работа
Достойное качество расшифровки (самое-то главное)
Разнообразие языков и форматов
Дружелюбный Tone of Voice (кому-то очень важно, мне в том числе)
Как бонус: сервис не хранит ваши расшифровки больше дня, поэтому с конфиденциальностью тоже всё в порядке
Единственное, хотелось бы иметь возможность редактировать имена говорящих и делиться ссылкой на результат расшифровки. Зачастую авторы / редакторы / пользователи расшифровывают аудио с двумя участниками и самостоятельно вычитывают черновики, поэтому сменить имена вручную несложно. И всё же команде проекта есть, куда расти.
И на этом про Any2text всё. А к дорогим читателям у меня вопрос: какой же тип подписки всё-таки лучше — по объёму или по времени? Ну, то есть за минуты или за месяц?
Делитесь своим мнением в комментариях. Ну, и скоро увидимся в новых обзорах крутых ИИ-сервисов.
Нейросеть для редактирования фото
Редачим любое фото в два клика — появилась полезная нейросеть Expression Editor. 👍
В ней можно быстро изменить форму рта или глаз, добавить улыбку, сменить положение головы и многое другое. И да, это БЕСПЛАТНО.
Бот для замены одежды на фото в нейросети. Инструмент для маркетплейсов OZON, Wildberries и др
Теперь в нейросети можно делать замену одежды на фото благодаря телеграм боту Yes Ai. Этот метод дает возможность виртуально изменять одежду людей с помощью двух изображений: одного, где изображен человек, и другого, на котором представлен желаемый комплект одежды. При формировании запроса пользователь может выбрать вид необходимой модификации: только верхняя часть тела, нижняя или полная замена гардероба. Полученные изображения отлично подходят для оформления каталогов товаров в маркетплейсах, таких как OZON, Wildberries и аналогичных ресурсах.
Рекомендации для успешного выполнения генерации по замене одежды на фото в нейросети
Кратко перечислим:
фото человека должно соответствовать пропорциям 3:4 (ширина к высоте);
загружайте исключительно правдоподобные изображения (фотографии), поскольку данная модель не предназначена для обработки художественных произведений или аниме-стиля;
при замене одежды предпочтительнее использовать аналоги по размеру и форме: футболки на другие типы верхней одежды, куртки на куртки, брюки на различные виды штанов и так далее. Попытка заменить длинное пальто на купальник может спровоцировать проблемы с качеством;
желательно использовать фото, где человек не закрывает руками элементы одежды, которые предполагается изменить.
Как заменить одежду на фото в нейросети, пошаговая инструкция
Вам нужно сделать несколько действий:
запустите Telegram и перейдите в бот @yes_ai_bot
в разделе меню снизу кликните на опцию "нейросеть: [изменить]"
в новом сообщении выберите "Stable Diffusion (для работы с изображениями)"
отправьте боту фото человека, чью одежду требуется заменить
после появления фото в чате, нажмите по кнопке «👗 Переодеть»
загрузите картинку с желаемой одеждой для замены
в следующем меню выберите метод замены: "«Верх», «Низ» или «Полностью»
За каждую заменю одежды (один запрос) вас ожидает пакет из трех генераций.
🧐 Предлагаем ознакомиться с демонстрацией возможностей нейросети по замене одежды на фото, посетив наш форум в Telegram: [Ссылка для просмотра].
Основное предназначение нейросети для замены одежды на фото внутри бота Yes Ai — это применение в электронной коммерции, особенно для разработки карточек товаров. С помощью данного инструмента вы сможете сократить расходы на проведение фотосъемок, так как и сами изображения, и модели на них могут быть созданы благодаря технологиям искусственного интеллекта, например, Stable Diffusion или Midjourney. В двух словах, вы можете создать уникальный образ модели с желаемыми характеристиками лица, позы и одежды в рамках одной нейросети.
Всё это и многое другое доступно на платформе Yes Ai Bot.
Генерации, созданные искусственным интеллектом, могут быть применены в дизайне ассортимента товаров на маркетплейсах, включая Wildberries и OZON.
Мы советуем просмотреть обучающее видео по применению инструмента для замены одежды на фотографиях:
Вопрос к специалистам и пользователям GPT 4 o1
Уже две недели как вышла новая версия GPT 4 o1.
Нашёл ли кто-то ей некое практическое применение, или это по прежнему просто очень умная игрушка, которую не понятно как использовать в обыденной жизни?















