Добавить пост

Искусственный интеллект

5 077 постов • 11 493 подписчика

Пост удален администрацией (запрещенный к публикации контент)⁠⁠1

5 лет назад

kv4k4zy4br4

Искусственный интеллект

Делать свои игры теперь можно прямо в БРАУЗЕРЕ⁠⁠

10 месяцев назад

Вышла крутейшее ИИ-приложение Dreamlab.

Работает просто: пишем запрос, а нейронка сгенерирует ваши идеи в проект. Есть готовые шаблоны для платформеров, шутеров и кликеров. Приложение научит вас всему само.

Еще есть КООП — можно делать игру вместе с друзьями и тестить проекты вместе.

Пользуемся — здесь.

Показать полностью

kv4k4zy4br4

Искусственный интеллект

Один из главных конкурентов ChatGPT МОЩНО обновился⁠⁠

10 месяцев назад

le Chat от Mistral теперь может:

— Генерить картинки: прикрутили топовую Flux Ultra;

— Le Canevas: буквально Canvas у ChatGPT;

— ПОИСК: работает даже на русском языке;

— Читать PDF: идеально для саммари документов;

— Умеет выполнять код: можно тестить программы или решать матан;

— Генерит текст со скоростью света: ТЫСЯЧА слов в СЕКУНДУ;

— И самое главное — всё это БЕСПЛАТНО!

Пока DeepSeek лагает, пробуем.

Показать полностью

Искусственный интеллект Нейронные сети ChatGPT DeepSeek Картинки Бесплатно Видео

dataist

Искусственный интеллект

От языковых моделей к моделям мира⁠⁠

10 месяцев назад

Большие языковые модели (LLMs) впечатляют умением работать с текстом, но они не имеют реального понятия о трёхмерном мире, физике и логике пространства. Модели мира (World Models) обещают сделать шаг вперед от текстового понимания к пониманию среды, наделяя ИИ способностью «видеть», «чувствовать» и «предсказывать» поведение объектов и агентов.

Если языковые модели генерируют последовательности слов, то модели мира стремятся к глубинному моделированию реальности. Они берут визуальные, аудио- и прочие сенсорные данные (включая данные от камер, IoT-сенсоров, микрофонов), чтобы создать внутреннюю симуляцию мира: с физическими законами, динамикой движения, взаимодействиями объектов, NPC и людей.

Одним из примеров таких систем стала Genie 2 — фундаментальная модель мира, способная на основе одного изображения создать интерактивное 3D-пространство, в котором можно управлять персонажем и выполнять различные действия. Genie 2 — авторегрессионная диффузионная модель, предсказывающая каждый следующий «кадр состояния» так же, как LLM предсказывает следующий токен. Но в отличие от чисто текстовых моделей, Genie 2 учитывает физику и трехмерность, позволяя агентам взаимодействовать со сценой. Это не просто генерация пикселей, а предсказание будущих состояний среды исходя из действий.

Другой пример - Sora от OpenAI, генерирующая до минуты реалистичного видео, моделируя динамику сцены, перспективу, свет, тени и взаимодействия с объектами. Подобно тому как языковые модели пользуются текстовыми токенами, модели мира работают с «патчами» — фрагментами визуальной информации. Sora сжимает входное видео в латентное пространство и разрезает его на патчи, которые затем обрабатываются трансформером.

Genie 2 и Sora способны «запоминать» объекты, моделировать эффекты гравитации и инерции, а также обеспечивать длительную согласованность сцен. В созданных ими виртуальных мирах персонажи стараются не терять форму, предметы не телепортироваться без причины — всё выглядит логичным и правдоподобным.

Помимо генерации видео, Sora может симулировать поведение внутри игры Minecraft, включая управление агентом. А Genie 2 позволяет создавать бесконечно разнообразные игровые миры, где поведение объектов и персонажей не задано вручную, а выучено моделью. Агенту можно дать задание и наблюдать, как он осваивает новые навыки, решает задачи и самостоятельно адаптируется к непредсказуемым условиям.

Все это ведет к тому, что роботы на базе моделей мира смогут лучше понимать пространство, предсказывать последствия своих действий и безопаснее взаимодействовать с реальным окружением.

Однако перед нами встают более глубокие вопросы: как интерпретировать решения агентов на базе моделей мира, как избежать опасных сценариев, если модель «догадается» нарушить правила? Такие случаи пока редки и напоминают курьёзы, но уже показывают, что серьезная работа над безопасностью только начинается

Конечно, обучение на огромных видеодатасетах требует колоссальных вычислительных мощностей, куда больше, чем для LLM. Также для обучения нужно много разнообразных данных. Но результат того стоит, ведь одно из перспективных направлений применения моделей мира - симуляция физических законов для развития науки и технологий. Например, использование химических элементов как «слов» в моделях мира позволяет ИИ предсказывать новые материалы или лекарства.

Модели мира — это переход от «умных слов» к «умным действиям» и пониманию пространства. Мы подходим к эпохе, когда ИИ будет предсказывать физические процессы, понимать причинно-следственные связи и даже проявлять «здравый смысл». Хотя модели мира только начали развиваться, но именно они способны заложить фундамент для ИИ, который будет не просто приятным собеседником в чате, а полноценным субъектом в нашем сложном реальном мире.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Показать полностью

[моё] Искусственный интеллект Sora

AgeOfIT

Искусственный интеллект

Riffusion генерация музыки⁠⁠

10 месяцев назад

Новая нейронка Riffusion бесплатно и безлимитно генерирует треки лучшего качества.

• Работает просто — вводим текст, жанр или любой звук (от взрыва до свиста).

• Продвинутые настройки — сложность лирики и мелодии, инструментал и уникальные стили.

• Готовые треки можно редактировать.

• ИИ запомнит ваши предпочтения, чтобы новые треки звучали всё лучше и лучше.

• Пишет текст для песен вместо вас как настоящий госстрайтер!

Сейчас идет бета-тест — ограничений ПОКА НЕТ, но через пару месяцев нейронка станет платной.

БЕСПЛАТНО

Ссылка

Источник

Показать полностью 1

Нейронные сети Искусственный интеллект Telegram (ссылка)

kv4k4zy4br4

Искусственный интеллект

Удаляем фон с фото и видео за ДВА КЛИКА⁠⁠

10 месяцев назад

Вышла мегаполезная нейронка BEN2.

Работает очень просто и точно: закидываем фотку или видос, нажимаем удалить фон, и тулза идеально обработает пиксели и выдаст идеальный результат.

Самое крутое, что это БЕСПЛАТНО. Забираем — здесь.

Показать полностью

Нейронные сети Искусственный интеллект Обработка фотографий Фотография Фон Видео Без звука Короткие видео

kv4k4zy4br4

Искусственный интеллект

Самые полезные нейросети собрали В ОДНОМ МЕСТЕ⁠⁠

10 месяцев назад

Hugging Face запустили каталог Spaces с 400 000 (!) нейронок на борту.

Там можно найти буквально все: фоторедакторы, ИИ для текста, озвучивания роликов и так далее. Есть удобные фильтры по категориям, поиск, а попробовать каждую можно не выходя из сайта.

Все работает БЕСПЛАТНО и без регистрации. Идем юзать — здесь.

Показать полностью

Нейронные сети Искусственный интеллект Каталог Все в одном месте Видео Короткие видео

kv4k4zy4br4

Искусственный интеллект

Deepseek теперь распознает рукописный ввод⁠⁠

10 месяцев назад

Китайцы выпустили новую модель DeepSeek-VL2-small.

В нее можно загрузить любой скриншот или фото с надписями от руки, а она перепишет весь текст или ответит на вопросы по нему. Понимает также графики и таблицы.

Для студентов это вообще имба. Пользуемся абсолютно БЕСПЛАТНО — здесь.

Показать полностью

DeepSeek Нейронные сети Искусственный интеллект Пропись Рукописный шрифт Видео Без звука Короткие видео