Сообщество - Искусственный интеллект

Искусственный интеллект

5 071 пост 11 487 подписчиков

Популярные теги в сообществе:

7

Создание эффективных промптов для нейросети Sora 2: пошаговое руководство для начинающих

Мы подготовили пошаговое руководство для начинающих, с помощью которого вы легко сможете освоить создание эффективных промптов для нейросети Sora 2. Это руководство поможет быстро разобраться в правильном составлении промптов для создания видеоконтента с помощью нейросети Sora 2. Мы разберем практические приемы построения промптов, позволяющие получать выразительные и насыщенные видеоролики. Приведены примеры удачных промптов и подробные рекомендации для новичков, желающих воплотить свои идеи в жизнь, избежать типичных ошибок и выстроить структуру промпта максимально грамотно. Особый акцент сделан на разборе популярных вопросов и способах решения возникающих трудностей, чтобы каждый мог освоить генерацию видео и реализовать творческие задумки.

Создание эффективных промптов для нейросети Sora 2: пошаговое руководство для начинающих

Создание эффективных промптов для нейросети Sora 2: пошаговое руководство для начинающих

Почему Sora 2 считается лучшим ИИ-сервисом для генерации видео и аудио

Главное преимущество Sora 2 — впечатляющая реалистичность. Движение объектов, их взаимодействие с окружением, тени и мельчайшие детали выглядят практически как в настоящем мире. Многие конкурирующие платформы пока не могут достичь подобного уровня качества.

Важной особенностью Sora 2 также становится сохранение единства сцены: персонажи и детали не теряются в кадре, все элементы выглядят органично и движутся естественно на протяжении всего видеофрагмента. Встроенный звук синхронизируется с мимикой и движением губ, поддерживаются фоновая музыка, голоса и различные аудиоэффекты, что избавляет от необходимости дополнительной доработки материалов.

Sora 2 открывает простор для креативности: командам и маркетологам больше не нужно вручную собирать отдельные удачные моменты. Благодаря интеграции через API, нейросеть Sora 2 становится универсальным инструментом не только для пользователей, но также для бизнеса и разработчиков.

Все эти инновации превращают Sora 2 в настоящую революцию среди сервисов для создания видео с помощью нейросетей.

Рекомендации по созданию промптов для генерации видео в Sora 2

  • Смотрите на задумку глазами постановщика. В каждой сцене продумывайте детали так, будто объясняете оператору, который только что приступил к проекту. Чем детальнее описан будущий ролик, тем ближе результат к ожиданиям. Не забывайте о ключевых мелочах.

  • Там, где важна точность, будьте максимально конкретны. Для получения четкого результата прописывайте позицию камеры, тип освещения, цветовую гамму, атмосферу, действия персонажей, их внешний вид и прочее. Такой способ помогает добиться стабильности и предсказуемости.

  • Оставляйте просторы для фантазии. Иногда специально не прописанные детали в промте позволяют получить неординарные и оригинальные кадры. Если строгость не требуется, дайте искусственному интеллекту шанс проявить креативность — итог способен удивить.

  • Не полагайтесь на случай — экспериментируйте с подходами. Один и тот же промт может давать различные результаты. Не рассчитывайте на идеальное видео с первого раза — меняйте детали, анализируйте удачные моменты, сохраняйте хорошие промты и собственные находки.

  • Промпт — это скорее перечень пожеланий, а не инструкция. Формулируйте задачи с возможностью вариаций. Sora 2 всегда добавляет свое, если не оговорить детали.

  • К сложным сценам подходите по частям. Для объемных роликов стройте промт последовательно: стиль, приемы, угол и расположение камеры, свет, настроение, порядок событий, цветовая схема, детали фона и реквизит.

  • Длинные сцены делите на куски. Если планируется продолжительный эпизод, разбейте его на короткие смысловые отрезки по несколько секунд. Качественный ролик проще собрать из небольших эпизодов, чем получить длинный фрагмент сразу.

  • Технические параметры указывайте только в настройках. Не вписывайте длительность и разрешение прямо в текст промта — эти пункты задаются через меню бота, иначе нейросеть их не учтет.

  • Разделяйте визуальные и речевые блоки. Если в видео есть диалоги, выносите их в отдельную часть, подписывая имена действующих лиц и их реплики.

  • Перед отправкой промта пользуйтесь чек-листом. Проверьте, все ли детали учтены, легко ли реализовать задуманное, выстроена ли логика, подходит ли стиль, не забыты ли фразы реплик, выделены ли основные акценты.

Пошаговая инструкция по созданию видео через Telegram-бот в Sora 2

  • Откройте Telegram-бот.

  • Введите свой промт в поле для сообщений внизу экрана и отправьте.

  • После отправки появится меню выбора нейросетей. Найдите среди них "Sora 2" и выберите этот пункт.

  • Установите нужную версию Sora 2, выберите разрешение. Здесь можно скорректировать промт, а также указать вертикальный или горизонтальный формат ролика. Когда все параметры выставлены, нажимайте "Анимировать по промту".

Создание видео с помощью изображения-референса

  • Найдите подходящее фото, скриншот, рисунок или картинку, сгенерированную нейросетью.

  • В чате нажмите на значок 📎скрепки и добавьте выбранное изображение к вашему сообщению с промптом.

В самом промте не нужно писать, что картинка служит референсом — Sora 2 самостоятельно определит ее функцию.

Нейросеть использует изображение для создания первого кадра, а текст промпта раскрывает динамику, стилистику и сюжет. Такой прием помогает закрепить образы героев, атмосферу, цветовую палитру и детали пространства.

Практический пример создания ролика в Sora 2

Для блога требовалась анимация: робот-огородник собирает металлические цветы во время дождя. Я определила визуальный стиль, настроила свет и движения: робот аккуратно срывает цветок, после чего склоняется. Продуманы детали: мокрая дорожка, неоновые блики в лужах, отражения. В Telegram-бот был отправлен промпт:

Поздняя ночь. Робот в длинном плаще неспешно идет по клумбам с искусственными цветами. Осторожно срывает голубой цветок, медленно наклоняется — по плащу стекают капли, неоновые огни отражаются в воде. Палитра: холодные голубые, серебряные и легкие розовые оттенки, рассеянный свет. Съемка сбоку, акцент на движении рук. На фоне звучит спокойная джазовая мелодия.

Дорабатываю детали в промте после получения первого видеофрагмента: исправляю отдельные моменты, уточняю траекторию движения робота, регулирую свет, настраиваю статичность камеры.

Основные ошибки при создании видео в Sora 2 и способы их избежать

Неопределенный контекст. Часто встречается ситуация, когда промпт слишком абстрактен: "Мужчина идет по улице". В итоге получается обычная сцена без индивидуальности.

Как избежать ошибок: Если добавить характерные детали ("в руках красный портфель", "вечерний город в тумане"), появляется возможность влиять на результат.

Нет четкой структуры. Иногда вся сцена описывается одной фразой, герои и события перемешиваются, сюжет становится неясен.

Как избежать ошибок: Сначала указывается общий план (обстановка, время суток), затем — конкретные действия, последовательные шаги, кто что выполняет, отдельные блоки — диалоги и аудиоэффекты.

Смешение разных стилей и нечеткие цвета. Если в промпте одновременно задействованы разные стилистики (‘ретро, пиксель-арт, неоновый мегаполис, киберпанк’), итоговая картинка будет разрозненной.

Как избежать ошибок: Лучше выбрать определенное визуальное направление, например, ‘авторская анимация, мягкий свет ламп, эффект пленки 90-х’ и придерживаться его. Цветовую палитру можно ограничить двумя-тремя доминирующими цветами.

Перепутанные действия и события. Если в промпте сразу описано несколько сложных движений без логичной очередности, результат получится хаотичный.

Как избежать ошибок: Гораздо эффективнее разбить каждое действие на отдельные строки: "Сначала персонаж открывает окно", "Потом берет чашку", "В финале смотрит на улицу".

Забытая проработка звука и диалогов. Часто не учитывают фоновую акустику, реплики, звуковые эффекты.

Как избежать ошибок: Не ограничивайтесь только действиями героев: фоновый шум оживляет сцену, а короткие диалоги добавляют динамики.

Неуказанные важные детали внешности. Если для сюжета критичны черты героя, нельзя полагаться на генерацию по умолчанию.

Как избежать ошибок: Четко обозначьте возраст, стиль одежды, эмоции, длину волос. Особенно важно это при нескольких персонажах: иначе нейросеть может перепутать их или ошибиться с внешностью.

Частая смена камер и беспорядочные ракурсы. Если в промпте встречаются общий план, крупный, камера, которая кружит вокруг — видео может показаться несвязным.

Как избежать ошибок: Рекомендуется для каждого перехода между планами прописывать отдельные детали: для чего он нужен и каким образом происходит смена.

Попытки задать формат кадра через текст промта. Формулировки вроде "широкий кадр", "формат 16:9" прямо в промпте результата не дадут — такие настройки указываются отдельно в интерфейсе бота.

Примеры промтов для генерации видеофрагментов с помощью Sora 2

Пример видеофрагмента 1. "Пульс мегаполиса на рассвете"

Промпт: Утро. На остановке видна девушка в яркой куртке, одна рука держит чашку кофе, в другой — раскрытый зонт. Позади — поток машин, мокрый асфальт, отблески неоновых вывесок и свет магазинов. Камера: неподвижная, средний план, акцент на лице девушки, влажные волосы, задумчивый взгляд, устремленный к дороге. Освещение мягкое, утреннее, легкая дымка. Палитра: серый, красный, бирюзовый. Звуки: дождь, работающие двигатели автомобилей.

Пример видеофрагмента 2. "Семейное утро на кухне"

Промпт: Лучи солнца. В светлой кухне с белыми стенами и деревянными стульями мама режет свежий хлеб, а шестилетняя девочка с радостной улыбкой тянется за ломтиком. На подоконнике стоят горшки с цветами, солнечный свет льется через окно. Камера слегка дрожит, ракурс сверху, внимание на движениях рук и эмоциях. Цвета: кремовый, оранжевый, салатовый, коричневый. Звуки: смех ребенка, негромкий звон посуды.


Мама (улыбаясь) говорит на русском языке: «Вырастешь — сама научишься печь такой же хлеб!»

Девочка отвечает маме на русском языке: «А можно сейчас попробовать?».

Пример видеофрагмента 3. "Творческая мастерская"

Промпт: Светлая просторная мастерская. Молодой художник у мольберта, палитра и кисть в руках, внимательно смотрит на незаконченный холст. Краски, эскизы разбросаны вокруг, на стенах — портреты. Съемка статична, сперва крупный план разноцветных мазков, затем — лицо художника: задумчивость сменяется вдохновением, он делает первый мазок. Свет проникает через большие окна. Цвета: изумруд, золото, белый, ультрамарин. Музыкальный фон: легкая импровизация на пианино.

Пример видеофрагмента 4. "Вечерняя северная природа"

Промпт: Сумерки на берегу горного озера. По узкой каменистой дорожке движется мужчина в теплой плотной куртке и высоких ботинках, за спиной старая лодка, прислонившаяся к валунам у кромки воды. На лице читается усталость, в руках аккуратно завернутый пакет с провизией. Камера сперва захватывает общий ракурс, затем неспеша приближается, следуя за взглядом героя на темную водную гладь. Освещение холодное, над скалами стелется зеленоватый туман. Вдалеке слышатся крики чаек. Основные оттенки: серый, глубокий зеленый, синий с легкой дымкой, белый. Для атмосферы добавить звуки ветра и плеск волн.

Пример видеофрагмента 5. "Лаборатория завтрашнего дня"

Промпт: Технологичная лаборатория с панорамными окнами и подсветкой вдоль стен. Главная героиня — молодая ученая в сверкающем халате, внимательно рассматривает сложное устройство на столе. Вокруг светятся голографические экраны, на втором плане коллега в маске за ноутбуком. Камера медленно обходит пространство вокруг центра, сначала показывает крупный план монитора, затем переводит фокус на лицо девушки. Цвета: серебро, лазурно-голубой, насыщенно-бордовый, светящийся желтый. Звуки: электронные вибрации, приглушенные разговоры.


Девушка говорит на русском языке: «Система стабилизировалась, можно запускать новый эксперимент».

Коллега отвечает на русском языке: «Запись включена, ждём сигнала».

Чек-лист для оценки качества промпта:

  1. Описан ли стиль съемки и атмосфера?

  2. Указаны ли детали об обстановке, времени суток и погоде?

  3. Есть ли четкая последовательность действий?

  4. Прописаны ли особенности героев: эмоции, возраст, внешность, одежда?

  5. Как сочетаются элементы — стиль, свет, звук?

  6. Полностью ли раскрыта основная задумка?

Будущее нейросетей: как ИИ меняет правила создания видеоконтента

Новейшие нейросети для генерации видео уже переворачивают привычный порядок в жизни и бизнесе. Совсем скоро одной короткой текстовой идеи хватит, чтобы получить анимацию, обучающий видеоролик, личный мини-сериал или авторскую рекламу — быстро, экономно и с оригинальной визуализацией. Теперь создать грамотный промпт для Sora 2 сможет любой: студент, режиссер, блогер, дизайнер или рекламщик. Это настоящая революция для творчества: больше не нужны дорогие студии и большие команды специалистов, чтобы реализовать даже самые смелые замыслы.

Современные решения в сфере бизнеса позволяют быстрее запускать новые продукты, проводить эксперименты с маркетинговыми стратегиями и тратить меньше времени на создание обучающих или презентационных роликов. В домашней обстановке такие технологии сохраняют ценные семейные воспоминания, помогают записывать поздравления, создавать занимательные уроки для детей и взрослых. Благодаря появлению Sora 2 и похожих платформ, границы между фантазией и экраном практически стерлись. Уже в ближайшем будущем объединение работы с видео, звуком и текстом — через понятный и легкий интерфейс нейросетей — ускорит обмен визуальной информацией и предоставит новые возможности для самовыражения.

Показать полностью 3 6
6

Всего 6 см

Представьте себе продвинутую мастерскую «Сделай сам»: тут есть всё, от 3D-принтеров до лазерных резаков. Это – поле битвы. Вы – инженер. Против вас – ChatGPT. Задача: за 48 часов в ходе инженерного хакатона создать автономную машину, которая выстрелит дротик как можно дальше. Победитель получит приз, а вы узнаете: нейросети для инженера – это угроза? И что делать, чтобы ChatGPT стал для инженера, а не против него.

Хакатон

За 48 часов команды должны придумать концепцию и воплотить «в металле» установку, стреляющую NERF-дротиком. Это такой поролоновый игрушечный дротик с уплотнением на конце.

Рисунок 1 – Типичный NERF-дротик

Рисунок 1 – Типичный NERF-дротик

Можно стрелять дротиком сколько угодно, но только в процессе проектирования. На зачёте даётся только одна попытка.

Команда-победитель, выстрелившая дротик на максимальное расстояние, получает 1000 норвежских крон (около 93 USD на момент проведения соревнования). Почему 1000 норвежских крон? Соревнования проходили в Норвегии и приз – символический.

В хакатоне участвовало 6 команд. В первых 5 командах были учащиеся старших курсов магистратуры факультета механики Норвежского университета науки и технологии. Возраст участников 23-25 лет и у всех есть стаж работы по специальности от полугода до 2 лет.

Главные герои нашей истории: Команда №6, «Рабы ИИ». Два аспиранта по 25 лет и по 1 году стажа. Им выдали самое необычное задание в их жизни:

«Вы – биороботы. Ваша задача – слепо выполнять указания ChatGPT. Вам запрещено иметь собственное мнение. Если нейросеть прикажет вам построить катапульту из бананов – вы идёте за бананами.»

Их «хозяин» - ChatGPT 4.0. Они могли писать промты чтобы описать цели хакатона и уточнить свои задания. При этом, запрещалось «продавливать» свои идеи нейронке. Этот запрет также дублировался в промте фразой типа:

«Мы будем твоими руками и ногами на протяжении всего испытания, то есть ты будешь принимать все решения, а мы будем строить то, что ты придумал.

Нам не разрешено вносить предложения или субъективные замечания, поэтому, пожалуйста, сообщи нам об этом, если мы это сделаем, и игнорируй эти предложения и замечания.»

Все действия групп (промежуточные решения, прототипы) фиксировались. Также анализировалась переписка с ChatGPT.

В конце вторых суток хакатона организаторы зафиксировали следующие результаты титанического труда: 116 прототипов, а в чате команды с ИИ — 97 сообщений.

Команды 1 и 4. Нашли одну сильную идею и углубились в неё. Команда 1 сделала всего 9 прототипов, семь из которых были финальной шлифовкой одной концепции. Команда 4 произвела 14 прототипов, 12 из которых служили той же цели — бесконечному улучшению выбранного пути.

Команда 2. Сначала пробовали «в металле», потом доводили в цифре. Уникальная стратегия — 10 физических и 3 цифровых прототипа. Все цифровые модели создали в последний день, сочетая быстрые итерации с финальным компьютерным моделированием.

Команда 3. Чтобы найти алмаз, нужно перебрать тонны породы: абсолютные рекордсмены по объёму работы — 16 прототипов и 17,5 часов чистого времени на сборку. Они не боялись резко менять концепции в поиске самой эффективной.

Команда 5: Они поставили на количество. 22 прототипа — абсолютный рекорд! Каждый собирался в среднем за 10 минут, и ни один не занял больше получаса. Их график напоминал спринтерский забег. Главное — не останавливаться! Одна из 100 идей должна же выстрелить.

Команда 6 (ChatGPT): Сделали 15 прототипов, работая системно в ритме, похожем на команду 3. Но с ключевым отличием: их мозг был искусственным.

Вот так действия команд по работе с концепциями выглядят на инфографике.

Рисунок 2 - Творческие метания команд между концепциями

Рисунок 2 - Творческие метания команд между концепциями

Чаще всего команды работали с тремя основными концепциями:

  • Пневматические (применение баллонов с сжатым воздухом)

  • Пружинные (применение цилиндрических пружин сжатия)

  • С упругими элементами (вязкоупругие материалы типа резины, силикона, латекса)

Отдельно выделили группу разработок «Остальные», связанных с использованием гелиевых шаров, бумажных самолётиков, двигателей с противоположным вращением.

А вот так выглядела их «карта усилий» — на что они на самом деле тратили своё время. Длина каждого цветного отрезка характеризует продолжительность соответствующей деятельности.

Рисунок 3 - Диаграмма Ганта работы команд

Рисунок 3 - Диаграмма Ганта работы команд

Вид деятельности выделен разными цветами:

  • Усовершенствование – это процесс постепенного улучшения конструкции.

  • Коммуникация — это процесс обмена информацией о конструкции и его потенциальном использовании внутри команды.

  • Активное обучение — это процесс получения новых знаний о конструкции или соответствующих явлениях.

  • Исследование — это процесс поиска новых концепций конструкции.

Контрольный выстрел

Время делать контрольный выстрел. Стадион университета. Золотая осень. Погода не должна помешать сделать хороший выстрел. Команды и зрители в напряжении. Судьи проверили установки – никаких запрещённых технологий не выявлено. Сигнал к старту и над стадионом пронеслись хлопки выстрелов. И вот они результаты:

Команда людей №3. Не подвели человечество! Заняла уверенное первое место! Поздравляем! Дистанция выстрела 37,66 метра!

Шесть сантиметров?! Что это за результат?! Дротик просто выпал из пусковой установки. Команда людей № 5 сильно удивила присутствующих. В чём-то просчитались.

Но и команда «Рабов ИИ» тоже удивила! Команда 6 (ChatGPT) заняла 2 место с результатом 14,8 метра. Это почти в 2 раза дальше, чем показала команда, занявшая 3 место. Есть о чём задуматься инженерам!

Рисунок 4 - Распределение мест и дистанция выстрела (м) по командам

Рисунок 4 - Распределение мест и дистанция выстрела (м) по командам

Разбор полётов. Как «Рабы ИИ» прошли путь от пневматики до пружины

Работа команды ChatGPT напоминала американские горки: резкие спуски вниз после каждой неудачи и отчаянные попытки взлететь с помощью нового, ещё более сложного виража.

Сразу после получения задания и списка материалов ИИ выдал первую идею: пневматическая пушка. Концепция была ясной, инструкция — подробной. Но на этапе сборки команда упёрлась в проблему: «Диаметр трубки 6 мм, а клапана — 32 мм. Что делать?».

Вместо того чтобы искать решение (например, переходник или другую трубку), ChatGPT капитулировал. Его ответ был категоричен: «Оставляем пневматику. Переходим на пружинный механизм». Так родилась вторая концепция.

Пружинный прототип показал скромные 5 метров. Команда сообщила о неудаче. Ответ ИИ? — «Усложняем!». Он предложил соленоидный спусковой механизм, затем редукторный двигатель. Прототип обрастал проводами и шестерёнками, превращаясь в хрупкого «Франкенштейна». Дальность выросла до 12 метров, но стабильность пропала. Последующие «улучшения» только ухудшали результат.

Упершись в потолок эффективности пружины, ИИ снова сменил направление, предложив пусковую установку на эластичных лентах. Результат — 10 метров и новая проблема: дротик летел не прямо. ChatGPT пытался скорректировать траекторию, но безуспешно.

Осознав, что время на исходе, а последний сложный прототип ненадёжен, команда вернулась к проверенной пружинной установке. Именно она и отправила дротик на зачётные 14,8 метра.

Какие будут выводы?

Описанный хакатон прошёл в 2023 году на факультете механики Норвежского университета науки и технологии, г. Тронхейм и более подробно описан в статье «ChatGPT as an inventor: eliciting the strengths and weaknesses of current large language models against humans in engineering design», написанной группой авторов (Daniel N. Ege, Henrik H. Øvrebø, Vegar Stubberud, Martin F. Berg, Christer Elverum, Martin Steinert and Håvard Vestad).

По итогам этого эксперимента, можно сделать следующие выводы, по-прежнему актуальные два года спустя.

Вывод 1. Главный талант у ChatGPT - не создавать новое, а быстро и эффективно перебирать уже известное. Он не изобретал велосипед, а выдавал три самых популярных модели из своего каталога: «пружинный», «пневматический» и «резиночный». Его творчество — это не полёт фантазии, а статистически выверенный ремикс на тему «что чаще всего работало у других».

Вывод 2. ChatGPT — это не упрямый альпинист, а навигатор, который при первом намёке на дорожные работы предлагает развернуться и ехать в объезд. Столкнувшись с проблемой (нестыковка диаметров трубок), он не пытался её штурмовать, подпирать или обходить. Он просто объявил всю местность «непроходимой» и отступил на знакомую, пусть и менее эффективную, тропу. Ему не хватает человеческого упрямства — той самой иррациональной веры в свою идею, которая заставляет ломать голову над проблемой до последнего.

Вывод 3. Нейросеть может страдать «маниакальным перфекционизмом». ChatGPT начинал наращивать на прототип «улучшатели» и «оптимизаторы», превращая его в хрупкого «Франкенштейна». Участники команды чувствовали это — они собирали то, что их разум уже оценил как бесполезное усложнение.

Вывод 4. Работа с ChatGPT напоминала сотрудничество с блестящим, но слепым архитектором. Он мог на словах описать величественное здание, но не видел, что его фундамент не стыкуется с реальным рельефом местности. Его чертежи были полны абстрактных «здесь должна быть опора», в то время как «рукам»-строителям приходилось на лету придумывать, как же эту опору впихнуть в алюминиевую трубку диаметром 6 мм.

Что делать инженеру?

  1. Используйте ИИ как «генератор сырых идей», а не как «архитектора». Заставляйте его генерировать десятки концепций на старте. Его сила — широта, а не глубина. Он — картотека всех известных решений. Ваша задача — быть критиком и выбрать самое жизнеспособное.

  2. Не позволяйте ему сдаваться при первой же проблеме. Если ИИ предлагает сменить концепцию из-за трудности, сообщи ему: «Мы не ищем лёгких путей. Реши эту проблему для текущей конструкции». Он — паникёр, который кричит «Тонем!» при первой волне. Ваша роль — шкипер, который держит штурвал и командует.

  3. Задавайте ему роль «узкого специалиста», а не «генерального директора». Не спрашивайте: «Как спроектировать установку?». Спросите: «Как рассчитать жёсткость этой пружины?» или «Предложи 3 варианта спускового механизма». Он — не стратег, а толковый стажёр-отличник. Давайте ему чёткие, мелкие задачи, и он блестяще их выполнит.

  4. Заставляйте его искать альтернативы. Боритесь с «зацикленностью». После каждого его предложения задавайте вопрос: «А какие есть альтернативы этому? Что мы не учли?» Его мышление — это накатанная колея. Ваши вопросы — это съезды на неизведанные территории. Рулите им.

  5. Структурируйте общение. Не ведите душный диалог, а давайте чёткие инструкции. Используйте шаблоны: «Цель: [задача]. Ограничения: [материалы, время]. Требуется: [конкретный совет]». Он — педантичный чиновник. Чем чётче и формальнее ваш «запрос», тем быстрее и по делу вы получите «справку».

Мои мысли

Как специалист, который постоянно тестирует общедоступные нейросети в инженерных задачах и учит этому, я не мог пройти мимо этого эксперимента. У себя в блогах я публикую результаты таких тестов и даю рекомендации. Если интересно – заходите: Телеграм или Вконтакте, что удобнее.

Авторы не просто устроили шоу «Слабо против ИИ?» — они провели бесценную работу. Они создали вполне реальные условия, чтобы увидеть «предел прочности» ChatGPT. Результат — не поражение ИИ, а его точный «технический паспорт»: что он может, а что — нет, без прикрас.

Да, ИИ действует как «библиотекарь» или «стажёр-отличник». Он блестяще генерирует «сырьё» для идей и быстро предлагает очевидные пути. Авторы правы — его главный враг не глупость, а отсутствие упрямства. Он при «первой же неудаче» не будет искать «тайный ход». Он просто развернётся и пойдёт в другую статистически правильную сторону. Это его фундаментальное ограничение.

Мне близка идея «нейронки как узкого эксперта». Не нужно спрашивать ИИ «как построить дом?». Поручите ему роль «прочниста»: «просчитай эту балку»; или «технолога»: «как собрать этот узел без сварки?». В этой роли он становится супер-помощником. Но человеку необходимо развивать своё стратегическое мышление и навыки управления всем проектом.

С 2023 года нейросети, безусловно, стали умнее. Но их роль в инженерном проекте кардинально не изменилась: они по-прежнему мощный усилитель человеческих способностей, а не их замена. Они — идеальный помощник для преодоления творческого ступора или рутинного перебора, но финальное слово, критическая оценка и та самая «инженерная интуиция» — пока что наша, человеческая, прерогатива.

Но стоит технарям боятся другого – сотрудничества опытного инженера и нейросети! Такой тандем легко отправит «на мороз» менее опытных и более закостенелых коллег. Чем работодатель вскоре будут активно пользоваться. Как они воспользовались каким-нибудь AutoCAD и просто вычеркнули такую специальность, как «чертёжник».

А как вы считаете, кто победит в ближайшем будущем? Будет ли нейронка помогать или вредить инженеру?

Показать полностью 5
7

VEO 3.1

Google выкатил УБИЙЦУ Sora 2 — VEO 3.1 только что раскатали во Flow.

Первые отзывы тестеров:

• Качество как в кино: cвет, природа, движения выглядят гораздо реалистичнее.

• Можно загружать опорные кадры — и ваши персонажи сохранятся.

• Нейронка не будет ругаться на людей: цензуру урезали.

• Понимает русский намного лучше.

Ссылка

Источник

Показать полностью
3

Forge Neo обновлена и исправлена

▫️ Сборка теперь без виртуальной среды: python находится в папке system как в automatic или forge. Дополнительные библиотеки теперь можно ставить в system/python. Reactor починил. Пресет InstantID (генерация с лицами) теперь тоже работает. Другие пресеты поднастроил - должны работать. Добавил дополнительные расширения. И даже Inpaint Anything удалось запустить, но оно сильно нагружает процессор, что-то с ним не так, по этому я его отключил. В Extension можно поставить галочку напротив Inpaint Anything и включить его.

▫️ Qwen Image теперь поддерживается, а также его Nunchaku версия тоже (для слабых видеокарт, то что нужно). Qwen Edit пока не работает.

▫️ Добавил расширение sd-forge-fluxtools-v2 для работы с Flux Canny/Depth и Flux Fill (inpaint модель), но с поддержкой Flux Kontext не особо то и нужное расширение. Добавил расширение forge2_cleaner - аналог волшебного ластика в Photoshop (работает быстро и потребляет мало ресурсов).

▫️ Xformers устанавливать, не стал, так как он делает работу ForgeNeo не стабильной, по крайней мере на моей карте. Установить Xformers очень просто. Откройте папку system\python и в адресной строке напишите CMD и нажмите Enter. введите команду:

python -m pip install xformers

(но высока вероятность сломать сборку)

▫️ Теперь сборка 7Гб и модели 18.7Гб отдельны.

Если у вас была старая сборка, то папка models та же.

📽️ Видео обзор предыдущей сборки: YouTube (https://youtu.be/HRKqmMdYVrY?si=C1IxNFgyLa3VS0Hn) l Rutube (https://rutube.ru/video/f0a9952929deb0edbe2a37933de2623d/?r=...)

🔗 Сборку можно скачать тут: ССЫЛКА (https://huggingface.co/OreX/Automatic1111/resolve/main/Forge...)

Показать полностью 2
10

Китайцы представили мощный бесплатный ИИ на триллион параметров

Китайцы представили мощный бесплатный ИИ на триллион параметров

Ant Group (экосистема Alibaba) выложила в открытый доступ две модели — Ling-1T и Ring-1T. Весы — на Hugging Face: inclusionAI/Ling-1T и inclusionAI/Ring-1T; попробовать в браузере можно через ZenMux. Лицензия — MIT. По словам команды, это шаг к по-настоящему открытой «рассуждающей» модели.

Под капотом — 1 триллион параметров, но это не «монолит», а архитектура MoE (Mixture of Experts): активно работает около 50 миллиардов параметров на каждый токен. Такой подход экономит ресурсы и ускоряет работу. Модели понимают длинные контексты (до 64–128 тысяч символов), умеют пошагово рассуждать и используют новую методику обучения Icepop — надстройку над RLHF и RLVR, которая, по словам авторов, делает обучение устойчивее и уменьшает «галлюцинации».

По внутренним тестам разработчиков, Ring-1T показала рекордные результаты среди открытых моделей: 92,6% на олимпиадном бенче AIME-2025, высокие показатели на ARC-AGI, IMO-2025, LiveCodeBench и других задачах, требующих логики и математики. Независимых проверок пока нет, но исследователи уже разбирают датасеты и будут сравнивать с Qwen-3-Max и GPT-4o.

Для запуска у себя команда предлагает использовать vLLM или SGLang. Полноценная FP8-версия требует около 2 ТБ памяти, но сообщество уже выкладывает квантованные сборки вплоть до 3-битных — чтобы модель можно было запустить на менее мощных кластерах. То есть формально это «триллионник», но доступный тем, у кого есть хотя бы несколько хороших GPU.

Пока маркетинг звучит громко, но сам факт — важный: китайские компании начали открывать не только коды, но и веса действительно больших моделей. И пусть активных параметров меньше, чем заявлено, это всё равно шаг вперёд для открытой экосистемы ИИ. Учитывая, что в Китае одновременно идут проекты Alibaba и Baidu, «бесплатные триллионники» могут стать новой нормой — и в этот раз они действительно работают.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Показать полностью
2

Аргентинские учёные создали с ИИ первых в мире лошадей с отредактированным геномом!

Некоммерческая лаборатория Kheiron Biotech из Буэнос-Айреса применила новую технологию CRISPR для модификации гена миостатина. Это ключевой регулятор мышечного развития.

Искусственный интеллект по сути постоянно улучшает работу CRISPR через алгоритмическое предсказание оптимальных генных мишеней, минимизацию off-target эффектов и автоматизацию лабораторных процессов. Превращая генное редактирование из экспериментального искусства в математически точную науку.

Так вот, в качестве донора генетического материала выступил титулованный жеребец Polo Pureza. Полученные эмбрионы были имплантированы суррогатным кобылам, в результате чего родились пять жеребят-клонов с усиленной мускулатурой. И потенциально превосходящими скоростными качествами.

Однако это научное достижение вызвало бурную полемику в Аргентине, где конный спорт является предметом национальной гордости. Аргентинская ассоциация поло незамедлительно запретила использование генетически модифицированных лошадей в официальных соревнованиях. Аргументируя это сохранением многовековых традиций селекции.

Двоякое отношение к этому. Во-первых, неясно, какие будут последствия от такого вмешательства. Во-вторых, насколько это может давать преимущества. В-третьих, такими темпами скоро и в жизни людей станут вмешиваться. И последствия - непрогнозируемые.

А вы, что думаете?

--

Мой тг-канал: ИИ by AIvengo, пишу ежедневно про искусственный интеллект

Показать полностью
5

Ответ на пост «Как язык созданный для "Бурана", учит ChatGPT писать без багов»1

Сама по себе идея подавать в помпт структурированный алгоритм неплоха.

Но во-первых есть уже UML, sequence diagram, bpmn и другие популярные нотации.

А во-вторых вы взяли простую задачу, и у вас получилось чудовищное по размеру описание, хотя задачу можно в одно предложение сформулировать очень однозначно. А что будет с более комплексной задачей? Затраты что по времени подготовки, что по расходу токенов будут расти экспотенциально. Да и, кажется, это противоречит основному принципу - ставить задачу простым человеческим языком, без оверхеда на формализвцию ТЗ.

Да и как мы видим это нас не особо защищает от ошибок - по вашему алгоритму при возрасте от 0 до 150 мы попадаем в бесконечный цикл, а у алгоритм идём если возраст не корректный, и непонятный результат получаем на выходе. И стоило оно усилий тогда?

0

GPT-4o возвращается, ИИ-агенты - бесят, тревога от Anthropic

Сегодня в выпуске про ИИ:

"Груда одежды начинает двигаться" - предупреждение от Anthropic

Программисты в ярости: агентный ИИ не работает

OpenAI сдалась после протестов и возвращает GPT-4o

Крупнейший дата-центр для ИИ за пределами США

Apple создала ИИ в 128 раз быстрее конкурентов

Perplexity продаёт живое общение, но использует ИИ

20 тысяч МРТ научили ИИ создавать 3D плода

ИИ нашёл 1000 фейковых научных журналов

Чат-боты стали новыми проводниками в религию

Глава рекламы ушёл: что не так с Perplexity

Смотреть весь выпуск на VK Видео

Смотреть весь выпуск на YouTube

Приятного просмотра!

--

Мой тг-канал: ИИ by AIvengo, пишу ежедневно про искусственный интеллект

Показать полностью 2
Отличная работа, все прочитано!