Сообщество - Искусственный интеллект

Искусственный интеллект

5 077 постов 11 491 подписчик

Популярные теги в сообществе:

8

Апскейлинг видео

EvTexture — новый метод апскейлинга видео
В методе EvTexture используется отдельный итеративный модуль улучшения текстуры, который позволяет получать информацию о событиях с высоким временным разрешением.

Этот модуль позволяет постепенно в несколько итераций уточнять текстуру заданных областей и повышать их разрешение.

Страничка EvTexture
GitHub
Источник

Показать полностью
0

Поющий Геральт

Тестируем новую чудо-нейросетку "Hedra".

Сперва по-быстрому сгеренировал портрет Геральта.

Потом применил к нему одну песню, которую я написал с помощью польскоговорящих членов своего Дискорд-сервера

Потом применил к нему одну песню, которую я написал с помощью польскоговорящих членов своего Дискорд-сервера

Вышло презабавно. Жалко только, что не всю смогло применить из-за ограничений.

Если кому интересно, оригинал песни тут:
https://suno.com/song/91e929f3-2b21-4f8a-a0fe-a07badb32a3a

Показать полностью 1 1
0

Заработок на дипфейках

Я пропал немного с виду. Но не просто так, эти два дня я разбирался и выполнял заказ на синхронизацию движений губ в видео с рекламным текстом.

Сложность в том, что нужно было не просто оживить статичное фото и наложить звук - с выходом Hedra это сделать можно за пару минут - а заменить озвучку и синхронизировать рот на уже готовом видео с достаточно активной динамикой и сменой планов.

Такие сервисы тоже есть, но чаще всего платные, и не особо дешевые. Например, в Di-D водяной знак убирают только если заплатишь 100$)

И я пошел шерстить просторы интернета в поисках подходящей программы. Потом вспомнил, что я уже упоминал такую, но не разобрался как она тогда работает - Wav2Lip.

Это программа с открытым исходным кодом и с большим количеством вариантов запуска ее - очень много людей сделали на ее основе блокноты в Google Colab, но почти все они уже не работают.

Многие платные сервисы под капотом у себя имеют именно эту программу, кто-то улучшенную, а кто-то чистую. Где-то, в пробном варианте платной нейросети результат у меня получался даже хуже, чем в итоге в этой бесплатной.

В итоге я нашел работающий блокнот, сделал тесты и приступил к работе. Почти весь день сегодня шаманил над роликом. Дополнительно у меня еще попросили еще движения рук персонажа состыковать со смыслом текста, поэтому пришлось делать дополнительный монтаж.

Само видео не буду сюда загружать, потому что его собираются использовать в рекламе, но завтра сделаю для Вас демонстрацию. Пока что можете сами попробовать разобраться в блокноте этой программы - по этой ссылочке.

Доброй ночи всем)

P.S. Пойду себе макарошки с сыром приготовлю.

Наш экспертный канал в Telegram | Наш бот GPT4o

Показать полностью
9

Поиск проектов по запросу

Поиск проектов по запросу

Сервис найдет абсолютно все проекты по запросу. Подскажет, реализовал ли кто-то до вас ЛЮБУЮ идею. Самое то для стартаперов!

Все ультра-просто: вбиваем запрос — поисковик подкидывает похожие сайты и приложения. Поможет найти нужный вайб и не повторяться.

Ссылка
Источник

Показать полностью
2

Open-Sora

Вышла новая версия Open-Sora с открытым исходным кодом.

На huggingface опубликована Open-Sora 1.2 от компании Hpcoretech.

Основные моменты:

Новая модель 1.1B, обучена на 20M видео и генерирует видео продолжительностью до 14 секунд с разрешением 720p.

Ссылка на HF

Источник

Показать полностью
3

Новый уровень ИИ с Claude 3.5 Sonnet

Новый уровень ИИ с Claude 3.5 Sonnet

Вот и Anthropic выпустили Claude 3.5 Sonnet, и это прям как новая песня в чартах ИИ-моделей. Все как в кино: OpenAI кидает на стол GPT-4o, Google отвечает Gemini 1.5 Pro, а тут Anthropic со своим Claude 3.5 Sonnet не отстает и поднимает ставки. Разработчики говорят, что новинка в два раза круче предыдущей версии и в тестах обходит конкурентов, как будто это гонки на спорткарах.

Что умеет Claude 3.5 Sonnet

Этот Claude 3.5 Sonnet не просто так получил свое имя. Он как хорошо отлаженный мотор, решает 64% задач, в то время как его предшественник Claude 3 Opus остановился на 38%. Это как если бы твой старый смартфон вдруг начал работать как новенький iPhone. Модель шарит в коде, может сама писать и редактировать его, а еще умеет разбираться в картинках и диаграммах, что для бизнеса, рознички и логистики — просто находка.

Claude 3.5 Sonnet и его визуальные способности

Claude 3.5 Sonnet еще и глазастый. В области компьютерного зрения он обгоняет предыдущую модель, умеет читать текст с картинок, даже если они не очень качественные. Это как супергерой, который видит сквозь стены.

Artifacts: Как Claude становится креативщиком

Anthropic еще и Artifacts представили. Это фишка, благодаря которой Claude может создавать код, тексты и дизайны прямо во время беседы с тобой. Это как иметь личного помощника, который не только понимает тебя с полуслова, но и сразу берется за дело.

Claude 3.5 Sonnet также способен создавать стихи на русском языке в рифму с первой попытки, и это действительно впечатляет! Эта возможность открывает новые горизонты для любителей поэзии и тех, кто ищет вдохновение или помощь в написании стихов. Благодаря продвинутым алгоритмам обработки естественного языка, Claude 3.5 Sonnet может мгновенно генерировать поэтические строки, учитывая ритм, рифму и эмоциональный оттенок, делая каждое творение уникальным и запоминающимся.

Claude 3.5 Sonnet: Больше, чем просто чат-бот

Claude 3.5 Sonnet скоро появится в YES Ai Bot в Телеграме. Это значит, что пользоваться всеми этими фишками можно будет прямо со своего смартфона.

Так что, Claude 3.5 Sonnet от Anthropic — это не просто новая версия ИИ. Это как открытие новой галактики во Вселенной искусственного интеллекта. Меньше известен, чем ChatGPT или Gemini, но уже показывает, что может стать настоящим звездным игроком на этом рынке.

Показать полностью 1
20

Распознавание текста от Microsoft

Распознавание текста от Microsoft

Нейронка Florence-2 Demo прочитает за вас неразборчивый текст и перепишет его нормальным шрифтом. Достаточно отправить фото с текстом, а в поле Task Prompt выбрать OCR. Применений масса: от расшифровки древних рукописей до почерка врачей Работает бесплатно и прямо в браузере.

Источник телеграм-канал NEUROHUB🔥👈 Ещё больше нейроконтента

Показать полностью 1
Отличная работа, все прочитано!