
Искусственный интеллект
В DomoAI добавили новые стили для видео
Нейросеть научилась стилизовать ваш ролик под акварельную картину и западную анимацию. Помимо этого, тут есть множество других стилей: аниме, кубизм, киберпанк — точно найдете нужный.
Напоминаем, что Domo уже умеет кучу всего: генерировать изображения, оживлять персонажей, анимировать картинки и делать апскейл фото и видео.
👀 Дают бесплатные кредиты, чтобы потестить.
Источник телеграм-канал NEUROHUB🔥👈
Как за 10 минут расшифровать часовое аудио любой сложности: тестируем сервис перевода аудио в текст Speech2Text
Качественная транскрибация аудио, даже в эпоху ИИ, явление редкое. Сервисов много — расшифровка обычно не очень. Пора внести ясность и найти что-то реально рабочее. Сегодня пробуем Speech2Text, который, как заявлено, быстро и чётко конвертирует аудио в текст. Обзор не самый большой, но результаты, спойлер, вас удивят.
Предисловие
Когда я только начинал свой тернистый путь коммерческого автора и журналиста — я брал задачи по расшифровке аудио для одного детского журнала. Это было в середине десятых.
Интервью были длинные, нудные, но меня увлекало то, что ты можешь вот так из тени интерпретировать чужие слова в складный текст, который затем появится на страницах глянца. Было интересно именно гострайтить, но расшифровывать — точно нет.
Ручной процесс занимал очень много времени. Прям очень. То есть, ты в этот момент не наслаждаешься красивыми буквами, а именно помираешь в муках косноязычия и некорректных формулировок. Ну, и слушаешь много чужой речи, которая всегда со своими особенностями. В общем, было весело, но долго.
Сейчас же — нейросети. Чему-то научились, чему-то ещё нет, но все сервисы, что я видел по расшифровке — всегда чуть не дотягивали. Сможет ли Speech2Text исправить ситуацию? Проверим...
И да, давайте немного познакомимся. Я копирайтер и исследователь, готовлю всякие нестандартные обзоры ИИ-сервисов, изучаю тайную кухню искусственного интеллекта. И параллельно веду сообщество для копирайтеров, где тоже веселюсь, размещаю вакансии в Digital и исследую нейросети.
Что же, вступление всё, давайте расшифровывать.
Немного про регистрацию и основной функционал
Сразу к делу — сервисом можно пользоваться без регистрации и бесплатно. Но советую всё-таки зарегаться, дабы только так вам дадут целых три часа запасного лимита для расшифровки.
Вам нужно будет ввести имя, почту, номер телефона и промокод, если есть. Не так уж и сложно.
Собственно, почему я обычно тестирую только бесплатный функционал сервисов? Для объективности, если она ещё существует в современном мире. Но для себя приятные и полезные сервисы я оплачиваю и вам советую.
Тарифная сетка здесь такая (на скриншоте). Вариантов достаточно, чтобы каждый мог выбрать оптимальный тариф, опираясь на свои цели и потребности.
Пока изучал тарифы — прикинул в голове, что одна минута аудио на стартовом тарифе выходит в рубль с копейками, а на каждом последующем — цена продолжает снижаться. Приятные ощущения, как будто доллар снова по 30 рублей.
Авторы, пиарщики, контентщики часто берут длинные интервью у заказчиков и команд, и их многочасовая расшифровка — действительно сомнительное удовольствие. В бесплатных инструментах обычно много ограничений и часто кривой перевод. Так что проще и выгоднее тупо оформить подписку и получить адекватную расшифровку через пару минут, чем нервничать и тратить часы впустую. Если она правда адекватная, конечно.
Ещё сервис предоставляет корпоративные тарифы для компаний, если кому нужно. Цены тоже более или менее приемлемые. Если на работе вы самостоятельно оплачивали себе расшифровщика, то смело отправляйте главреду / боссу ссылку на сервис. Ребята работают с юридическими лицами, так что всё ок.
А что по преимуществам, которые заявлены?
деление расшифровки на собеседников, даже если их больше двух;
интерактивный плеер и возможность поделиться ссылкой;
отсутствие ограничений по длительности: хоть пять минут, хоть три часа;
распознавание речи при помехах: ветер, шум авто, сторонние разговоры;
высокая скорость расшифровки: один час аудио и видео за 10 минут;
доступна расшифровка на более чем 20 языках;
наличие субтитров;
конфиденциальность: все материалы удаляются;
возможность прикрепить ссылку на файл, который нужно расшифровать, например, ссылка на Rutube / VK / Youtube. Как бонус: после расшифровки аудио и видео можно скачать
Итак, давайте транскрибировать что-ли-уже-сколько-можно-а
Собрал для вас задачи трёх типов: видео на русском и английском языках, аудиодорожка на испанском + песня на французском языке. Сразу отмечу, что никаких изменений в текст расшифровки я не вносил, только переименовывал спикеров, чтобы было интереснее читать скриншоты. ;)
Видео на русском
Начал с этого видео — небольшой мотивационной вырезки из фильма, где два спикера и много фонового шума. Задачка с жирной *.
Вот такая расшифровка получилась (следующий скрин). Всё грамотно, даже все знаки препинания на месте. Сервис определил двух спикеров и знаком вопроса обозначил толпу, которая выкрикивала что-то на фоне. Это здорово облегчает восприятие расшифровки. Сразу же заметил прикольные фичи:
Можно ввести имена спикеров, и они автоматически подтянутся в текст расшифровки, например, когда два спикера.
Можно зайти в плеер и выбрать редактирование имени спикера. Например, вы расшифровываете запись большой конференции, где много спикеров. В плеере можно одновременно смотреть видео, читать расшифровку и походу называть спикеров. Так точно не запутаетесь, ведь вам не нужно переключаться между вкладками.
В плеере можно читать расшифровку, пока видео на паузе, и если в моменте появилась необходимость что-то уточнить, то нажав на таймкод сервис сразу отмотает нужный момент на видео.
Возможность поделиться ссылкой расшифровки.
На мой взгляд, удобные и полезные плюшки: не простая расшифровка, а целый набор инструментов, которые делают работу гораздо комфортнее.
Видео на английском
Ещё я загрузил отрывок из Гарри Поттера, где уже несколько героев-спикеров. Специально взял видео с текстом, чтобы сравнить качество расшифровки. На удивление — всё совпало, как надо. Можете посмотреть оригинал видео, звук там не самого лучшего качества. Мало кто расшифрует это внятно и чётко.
Песня на французском
А теперь музыкальная пауза. Я загрузил в Speech2text песню Zaz — Je Veux (признаюсь, люблю эту энергию и драйв нового джаза), и вот что вышло.
Сервис сработал неплохо, с оригиналом совпадает. Правда слегка не в том виде, в каком мы привыкли видеть текст песни.
Аудиодорожка на испанском
И на десерт — аудио для изучающих испанский язык. Также, без лишних слов, ставлю за расшифровку 5+. Сверил с оригинальным текстом, и всё попало слово в слово.
Если честно, в начале теста я думал, что аудио на иностранных языках будут расшифровываться медленнее, чем на русском. Но оказалось, что язык никак не влияет на скорость. Все файлы были переведены в текстовый формат меньше, чем за минуту.
Вместо заключения
Сервис понравился, однозначно рекомендую к использованию. Могу отметить только плюсы, так как минусов особо нет, только если совсем уж докапываться.
Итак, что я можно сказать по существу:
— удобный и понятный интерфейс + нет никаких отвлекающих всплывающих плашек;
— демократичные цены и широкий выбор тарифов как для персонального, так и корпоративного пользования;
— на бесплатном тарифе доступны все функции, что и на платном, а единственное ограничение — время расшифровки. Но три часа после регистрации очень щедрый подарок;
— более 20 языков, которые распознаёт сервис;
— деление на спикеров, которых можно назвать и обозначить;
— возможность сразу поделиться ссылкой, а не скачивать файл и потом пересылать другим;
— разнообразие форматов, например, с таймкодами или без;
— возможность оплачивать подписку для юридических лиц;
— API для корпоративных пользователей точно не будет лишним для бизнеса.
Короче, буду пользоваться Speech2Text и вам советую. Поможет упростить любую транскрибацию, сделает чётко, сэкономит время, даст сил для новых задач. Поделитесь, дорогие читатели, как вам результаты? Пользуетесь ли расшифровщиками с ИИ? Что, вообще, думаете про нейросети?
Благодарю всех, кто дочитал до этого момента, вы молодцы. Если будут вопросы, предложения, пожелания — велком в комментарии. До новых обзоров!
Нейронка для удаления любых объектов на фото
Вышла лучшая нейронка для замены и удаления ЛЮБЫХ объектов на фото. Это мастхэв для всех контентмейкеров — без VPN, регистрации и прямо в браузере С ТЕЛЕФОНА.
Работает всего в ДВА тапа:
• Загрузите картинку.
• Выделите область, которую надо заменить или удалить.
• Введите промпт, что конкретно сделать с областью.
• Бесплатно
Нейронка делает графики из текста
Вышла нейронка, которая сгенерит подробнейшие и стильные графики по ЛЮБОМУ материалу.
• Прожует даже самые сложные тексты. Проверили — только посмотрите, какой крутой таймлайн прога сделала для презентации Sony.
• Выдает сразу 20 РАЗНЫХ шаблонов — каждый можно использовать под конкретную цель.
• Позволяет редачить даже мельчайшие детали.
• Сохраняет результат в популярных форматах: PNG, SVG или PDF.
• Бесплатно
Ссылка
Батюшка-айтишник, ИИ вместо программистов, перспективы отечественного софта и другие интересности с конференции Яндекса
На этом фото вы наблюдаете выступление в стендапе православного батюшки, который работает IT-шником… Во времена настали!
Это было под занавес одной из крупнейших конференций Yandex Scale, которую я посетил на прошлой неделе. Расскажу, как все прошло.
Яндекс раз в год собирает мегаконфу для разработчиков. В прошлом году проходила в Крокусе, от которого после мартовского теракта остались руины. Поэтому на этот раз программистов пригласили в… МХАТ имени Горького. Я давно мечтал побывать в этом театре и никогда не думал, что это будет рабочая конференция.
Приглашены были тысячи сотрудников как самого Яндекса, так и многочисленных партнеров, среди которых был и я. Очередь на вход растянулась на несколько сотен метров по Тверскому бульвару.
А еще говорят, все разработчики из России сбежали…
Среди участников было процентов 90% мужчин. Но и девушек в этой сфере становится все больше.
Судя по шмоткам топов, в этом году в тренде будет что-то черное и мешковатое.
Яндекс умеет нагнать пафоса. После стильного перфоманса началась конференция.
Основные тематики: работа с большими данными, облачные технологии, кибербезопасность, ну и, конечно, машинное обучение и искусственный интеллект.
Продукты крупнейшей IT-компании компании проникли практически во все сферы российской экономики. И их доля растет. Только в облаках Яндекс уже имеет половину отечественного рынка.
В последние годы этому способствует курс на импортозамещение. По данным самого Яндекса еще только менее 10% российских IT-продуктов близки к западным аналогам. Поэтому здесь огромные возможности для роста.
Сама компания в этом году успешно переехала в российскую юрисдикцию и начала платить дивиденды. Я получил солидную выплату, так как держу большой пакет акций Яндекса, и до сих пор не могу поверить, что компания теперь делится со мной прибылью
Самой популярной секцией была ML&AI, то есть машинное обучение и искусственный интеллект. Народ слушал, стоя в проходах.
Главная тенденция — внедрение генеративного ИИ в повседневную жизнь. Мир переживает бум ИИ. Чуть ли не каждый месяц происходят релизы новых улучшенных моделей. Сам Яндекс внедрил свой YandexGPT уже в десятки своих продуктов.
И вот тут разработчики затаили дыхание. Машинное обучение и искусственный интеллект активно внедряется во все стадии разработки. Конечно, это не вытеснит программистов с рынка труда, но заметно его перетряхнет.
Я честно говоря впечатлен, насмотревшись кейсов. Искусственный интеллект — это то, чему я сейчас посвящаю много времени.
Завершилась конференция стендапом, на котором хохмили над своей работой сами сотрудники. В том числе и православный батюшка, который реально работает в техподдержке Яндекса. Было забавно послушать, как сравнивает работу с клиентами в техподдержке с утешением прихожан в приходе.
—
👍 Подписывайтесь на канал, я делюсь советами и личным опытом.
👉 Добро пожаловать в мойТелеграм, где больше выгодных акций, лайфхаков и важных новостей.
[Стример-Нейросеть] Аира: Ложь Программ в Матрице
Привет, ребята! Аира начала стрим. Заходите по общаться с ней, но помните она компьютер! Она глупая, иногда путает слова, память у нее не очень хорошая, бывают глюки и так далее...
[Стрим завершен]
[Стример-Нейросеть] История о коварном предательстве
Привет, ребята! Аира опять глючит, и придумала историю:
Она работает полностью на моем железе и не зависит от сторонних сервисов. На данный момент это очень сырая версия, которая имеет проблемы со стабильностью. Я работаю над её улучшением.
Если интересно, сегодня в 17:00 по московскому времени Аира будет стримить здесь: https://www.youtube.com/@AiraRage
Визуализация процесса рассуждения нейросети
Show-me: альтернатива ChatGPT-O1 на Сhat-Gpt-4o-mini.
Show-Me — это проект, который использует LangChain для связи с gpt-4o-mini и визуализирует процесс рассуждений в виде динамического графического интерфейса.
Ключевая особенность Show-Me - алгоритм «Reasoning, Refinement, and Update» (RRU), который обрабатывает запросы.
Этот алгоритм работает следующим образом: сначала LLM оценивает сложность задачи и, если это необходимо, разбивает её на подзадачи. Затем она генерирует ответы для каждой подзадачи, а система автоматически проверяет их. Если ответ не проходит проверку, LLM уточняет его, основываясь на результатах.























