Сообщество - Искусственный интеллект

Искусственный интеллект

5 077 постов 11 493 подписчика

Популярные теги в сообществе:

8

Делать свои игры теперь можно прямо в БРАУЗЕРЕ

Вышла крутейшее ИИ-приложение Dreamlab.

Работает просто: пишем запрос, а нейронка сгенерирует ваши идеи в проект. Есть готовые шаблоны для платформеров, шутеров и кликеров. Приложение научит вас всему само.

Еще есть КООП — можно делать игру вместе с друзьями и тестить проекты вместе.

Пользуемся — здесь.

Показать полностью
14

Один из главных конкурентов ChatGPT МОЩНО обновился

le Chat от Mistral теперь может:

— Генерить картинки: прикрутили топовую Flux Ultra;

— Le Canevas: буквально Canvas у ChatGPT;

— ПОИСК: работает даже на русском языке;

— Читать PDF: идеально для саммари документов;

— Умеет выполнять код: можно тестить программы или решать матан;

— Генерит текст со скоростью света: ТЫСЯЧА слов в СЕКУНДУ;

— И самое главное — всё это БЕСПЛАТНО!

Пока DeepSeek лагает, пробуем.

Показать полностью
3

От языковых моделей к моделям мира

От языковых моделей к моделям мира

Большие языковые модели (LLMs) впечатляют умением работать с текстом, но они не имеют реального понятия о трёхмерном мире, физике и логике пространства. Модели мира (World Models) обещают сделать шаг вперед от текстового понимания к пониманию среды, наделяя ИИ способностью «видеть», «чувствовать» и «предсказывать» поведение объектов и агентов.

Если языковые модели генерируют последовательности слов, то модели мира стремятся к глубинному моделированию реальности. Они берут визуальные, аудио- и прочие сенсорные данные (включая данные от камер, IoT-сенсоров, микрофонов), чтобы создать внутреннюю симуляцию мира: с физическими законами, динамикой движения, взаимодействиями объектов, NPC и людей.

Одним из примеров таких систем стала Genie 2 — фундаментальная модель мира, способная на основе одного изображения создать интерактивное 3D-пространство, в котором можно управлять персонажем и выполнять различные действия. Genie 2 — авторегрессионная диффузионная модель, предсказывающая каждый следующий «кадр состояния» так же, как LLM предсказывает следующий токен. Но в отличие от чисто текстовых моделей, Genie 2 учитывает физику и трехмерность, позволяя агентам взаимодействовать со сценой. Это не просто генерация пикселей, а предсказание будущих состояний среды исходя из действий.

Другой пример - Sora от OpenAI, генерирующая до минуты реалистичного видео, моделируя динамику сцены, перспективу, свет, тени и взаимодействия с объектами. Подобно тому как языковые модели пользуются текстовыми токенами, модели мира работают с «патчами» — фрагментами визуальной информации. Sora сжимает входное видео в латентное пространство и разрезает его на патчи, которые затем обрабатываются трансформером.

Genie 2 и Sora способны «запоминать» объекты, моделировать эффекты гравитации и инерции, а также обеспечивать длительную согласованность сцен. В созданных ими виртуальных мирах персонажи стараются не терять форму, предметы не телепортироваться без причины — всё выглядит логичным и правдоподобным.

Помимо генерации видео, Sora может симулировать поведение внутри игры Minecraft, включая управление агентом. А Genie 2 позволяет создавать бесконечно разнообразные игровые миры, где поведение объектов и персонажей не задано вручную, а выучено моделью. Агенту можно дать задание и наблюдать, как он осваивает новые навыки, решает задачи и самостоятельно адаптируется к непредсказуемым условиям.

Все это ведет к тому, что роботы на базе моделей мира смогут лучше понимать пространство, предсказывать последствия своих действий и безопаснее взаимодействовать с реальным окружением.

Однако перед нами встают более глубокие вопросы: как интерпретировать решения агентов на базе моделей мира, как избежать опасных сценариев, если модель «догадается» нарушить правила? Такие случаи пока редки и напоминают курьёзы, но уже показывают, что серьезная работа над безопасностью только начинается

Конечно, обучение на огромных видеодатасетах требует колоссальных вычислительных мощностей, куда больше, чем для LLM. Также для обучения нужно много разнообразных данных. Но результат того стоит, ведь одно из перспективных направлений применения моделей мира - симуляция физических законов для развития науки и технологий. Например, использование химических элементов как «слов» в моделях мира позволяет ИИ предсказывать новые материалы или лекарства.

Модели мира — это переход от «умных слов» к «умным действиям» и пониманию пространства. Мы подходим к эпохе, когда ИИ будет предсказывать физические процессы, понимать причинно-следственные связи и даже проявлять «здравый смысл». Хотя модели мира только начали развиваться, но именно они способны заложить фундамент для ИИ, который будет не просто приятным собеседником в чате, а полноценным субъектом в нашем сложном реальном мире.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Показать полностью
4

Riffusion генерация музыки

Riffusion генерация музыки

Новая нейронка Riffusion бесплатно и безлимитно генерирует треки лучшего качества.

• Работает просто — вводим текст, жанр или любой звук (от взрыва до свиста).

• Продвинутые настройки — сложность лирики и мелодии, инструментал и уникальные стили.

• Готовые треки можно редактировать.

• ИИ запомнит ваши предпочтения, чтобы новые треки звучали всё лучше и лучше.

• Пишет текст для песен вместо вас как настоящий госстрайтер!

Сейчас идет бета-тест — ограничений ПОКА НЕТ, но через пару месяцев нейронка станет платной.

БЕСПЛАТНО

Ссылка

Источник

Показать полностью 1
15

Удаляем фон с фото и видео за ДВА КЛИКА

Вышла мегаполезная нейронка BEN2.

Работает очень просто и точно: закидываем фотку или видос, нажимаем удалить фон, и тулза идеально обработает пиксели и выдаст идеальный результат.

Самое крутое, что это БЕСПЛАТНО. Забираем — здесь.

Показать полностью
4

Самые полезные нейросети собрали В ОДНОМ МЕСТЕ

Hugging Face запустили каталог Spaces с 400 000 (!) нейронок на борту.

Там можно найти буквально все: фоторедакторы, ИИ для текста, озвучивания роликов и так далее. Есть удобные фильтры по категориям, поиск, а попробовать каждую можно не выходя из сайта.

Все работает БЕСПЛАТНО и без регистрации. Идем юзать — здесь.

Показать полностью
9

Deepseek теперь распознает рукописный ввод

Китайцы выпустили новую модель DeepSeek-VL2-small.

В нее можно загрузить любой скриншот или фото с надписями от руки, а она перепишет весь текст или ответит на вопросы по нему. Понимает также графики и таблицы.

Для студентов это вообще имба. Пользуемся абсолютно БЕСПЛАТНО — здесь.

Показать полностью
6

QwenLM научился генерировать видео

Правда 5 секунд всего. Иногда такая дичь получается, но этот видос мне понравился.

Юзаем здесь 👈

PS. Работает бесплатно и частенько получаются китаянки)

Показать полностью 1
Отличная работа, все прочитано!