
Искусственный интеллект
Дайджест новостей про ИИ в России и мире с 17 по 23 мая
Anthropic представила Claude 4 — самое новое поколение моделей. Claude Opus 4 — модель для кодинга, которая обеспечивает устойчивую производительность при выполнении сложных, длительных задач и рабочих процессов ИИ-агентов. Claude Sonnet 4 — обновление Claude Sonnet 3.7, апгрейд функций кодирования и рассуждения, показывает более точную реакцию на инструкции.
Яндекс анонсировал большое обновление поиска с участием ИИ: в поиск интегрирован AI помощник Алиса, которая создаёт структурированные ответы с изображениями и видео, помогает выбирать товары и генерирует контент прямо в поиске. Возможности Алисы в Поиске уже доступны всем пользователям ya.ru и приложения Яндекс с Алисой, а подписчики Алисы Про смогут пользоваться ими без ограничений.
OpenAI выпустила модель Codex-1 на базе версии o3. Модель оптимизирована для разработки ПО. Это своеобразная команда ИИ-агентов, которая пишет и одновременно исправляет код, умеет запускать код прямо в браузере для тестирования, а также может работать над несколькими задачами параллельно. Пока Codex доступна только для пользователей подписок Pro, Enterprise и Team, остальные получат доступ позднее.
Новости с ежегодной конференции Google I/O 2025:
Представлены новые генеративные модели Imagen 4 и Veo 3, а также инструмент Flow. Imagen 4 создаёт изображения с более высокой детализацией и лучше справляется с текстом на картинках. Veo 3 научился генерировать ролики с аудио. Flow — это ИИ-инструмент, который объединяет возможности Veo, Imagen и Gemini, позволяя с помощью текстовых описаний создавать видеоистории с контролем персонажей, локаций и стилей.
Интерактивный режим общения с нейросетью Gemini Live стал бесплатным для всех на Android и iOS.
Gemini интегрируется в браузер Chrome (пока только в США).
Stability AI и Arm выпустили компактную модель преобразования текста в звук, которая работает на смартфонах и способна генерировать стереофонические аудиоклипы продолжительностью до 11 секунд — Stable Audio Open Small.
Microsoft представила ИИ-агента для GitHub. Новая опция доступна всем подписчикам Copilot Enterprise и Copilot Pro+. После подключения ИИ-агент создаст в виртуальной машине клон репозитория и проанализирует код.
Google тестирует новый экспериментальный режим Deep Think для Gemini 2.5 Pro, который расширяет возможности анализа и обеспечивает вывод звука. Новый режим нужен, чтобы помочь модели оценить несколько гипотез, прежде чем отвечать на запрос. Пока режим тестируется на ограниченной группе пользователей Gemini API.
Google выпустил нового ИИ-агента для программирования «Jules». Он предназначен для помощи разработчикам в выполнении повторяющихся задач (исправлении ошибок, написании документации, создании тестов и разработке функций). Jules работает асинхронно и использует модель Google Gemini 2.5 Pro, которая оптимизирована для программирования.
Ну и без курьезов опять не обойдемся. Сегодня их даже два) Вот первый: студентка в США потребовала вернуть $8000 за обучение, поймав профессора на использовании ChatGPT. Несправедливость, по ее мнению, в том, что студентам запрещено пользоваться чат-ботом для подготовки к занятиям. А вот второй: газета Chicago Sun-Times опубликовала список рекомендуемой литературы для летнего чтения. 10 книг из 15-ти в списке оказались выдуманы ИИ.
CapCut представил ИИ-аватаров
Dreamina — это платформа, интегрированная в экосистему CapCut, которая предоставляет инструменты на основе ИИ для создания и редактирования изображений, видео и ИИ-аватаров. Достаточно авторизоваться через почту и можно пользоваться новыми инструментами.
Самый любопытный инструмент - LipSync, вы буквально можете сделать своего видеоаватара из фото, при этом аватар будет двигаться и жестикулировать.
Загружаете фото персонажа, печатаете текст и выбираете голос озвучки либо загружаете свое аудио до 15 секунд.
Ежедневно дается 120 ежедневных кредитов, которые вы можете потратить по своему усмотрению. Но нужен иностранный IP-адрес. А можно зарегистрироваться по почте Google и сделать несколько актов, зная эту фичу.
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Еще:
А если вам не хочется заморачиваться, в боте Syntx -- это мини приложение в телеграм, есть все популярные модели в единой подписке, и их можно оплатить русской картой. - Процесс я показала на примере создания Нейрофотосессии со своим лицом
ИИ-АГЕНТ, КОТОРЫЙ УМЕЕТ ВСЁ
II-Agent — самый мощный open-source агент на сегодня. Работает с файлами, кодит, анализирует, автоматизирует.
Что может:
🔘 Читает, редактирует и создаёт файлы.
🔘 Проводит глубокие ресёрчи и строит логические цепочки.
🔘 Пишет код, разворачивает сайты, управляет терминалом.
🔘 Автоматизирует задачи в браузере.
🔘 Делает презентации, графики, видео и отчёты.
Опережает Manus, Genspark и Operator.
Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
Google I/O 2025: Главные Новинки от Google. Продолжение
Продолжаю рассказывать НАГЛЯДНО про новинки, Кто пропустил:
Про голосового ассистента будущего Project Astra в этом посте
Про новинки в Gemini 2.5, про их мощный поиск, про Google Meet с синхронным переводом я рассказала в этом посте. — Особенно про Виртуальную примерку одежды рекомендую (в выпадающем окошке). Смысл, что одежда подстраивается под вас - НАГЛЯДНОЕ ВИДЕО:
NotebookLM
В NotebookLM теперь можно создавать видео-обзоры на основе ваших текстов, PDF, сайтов и других источников. - Наглядное пример такого видео-обзора в видео 2 с переводом:
Все видео я автоматически перевела в Elevenlabs с сохранением голоса.
Еще у NotebookLM появилось официальное приложение. Можно загрузить любые источники (PDF, сайт, видео с YouTube, текст), и получить ответы на вопросы, еще можно получить подробный конспект или рецензию, а еще с недавних пор NotebookLM может преобразовать ваши файлы в подкаст с двумя ведущими — в том числе на русском. Мой обзор с полученным подкастом в этом посте.
Jules
Уже можно попробовать Jules (с иностранным айпи) - это универсальный ИИ-агент для разрабов, подключаетсяк любому репозиторию GitHub, пишет целые кодовые базы и проверяет их в облачной виртуальной машине. Умеет придумывать новые тесты и объясняет каждый свой шаг.
Наглядно с передом все шаги показаны на видео 3:
Бесплатно доступно 5 задач каждый день. Сравнивают с платным Codex от OpenAI за $200/мес
Гайд по Jules
В следующем посте расскажу про Imagen 4, Veo 3 и Flow — новые инструменты для генерации изображений и видео, которые просто взрывают мозг! А в моем телеграм канале этот пост появится гораздо раньше.
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Еще:
А если вам не хочется заморачиваться, в боте Syntx -- это мини приложение в телеграм, есть все популярные модели в единой подписке, и их можно оплатить русской картой. - Процесс я показала на примере создания Нейрофотосессии со своим лицом
Почему AI на текущий момент даёт больше обычным людям, чем корпорациям и государству - Андрей Карпатый
Андрей Карпатый, один из основателей OpenAI и бывший директор по ИИ в Tesla, недавно поделился наблюдением: большие языковые модели (LLM) меняют традиционную траекторию распространения технологий. Обычно инновации сначала внедряются в военной сфере, затем в корпорациях и, наконец, доходят до обычных пользователей. Однако с LLM всё иначе — они приносят наибольшую пользу именно индивидуальным пользователям, а не крупным организациям .X (formerly Twitter)
Почему LLM — это революция для обычных людей
Карпаты отмечает, что LLM предоставляют "квази-экспертизу" по многим вопросам, позволяя людям без специализированного образования:
Писать код, используя простые описания задач.
Анализировать большие объемы данных и извлекать из них инсайты.
Создавать качественный контент и презентации.
Получать советы по различным вопросам, от юридических до психологических.
Эти возможности делают LLM мощным инструментом для самообразования и повышения эффективности в повседневной жизни.
Почему корпорации и государства отстают
В отличие от индивидуальных пользователей, крупные организации сталкиваются с рядом препятствий при внедрении LLM:
Бюрократия и инерция: Процессы согласования и внедрения новых технологий в больших структурах занимают много времени.
Ограничения по безопасности и конфиденциальности: Использование LLM может вызывать опасения по поводу утечки данных.
Необходимость адаптации под существующие процессы: Интеграция LLM требует значительных изменений в рабочих процессах.
В результате, пока организации только начинают осваивать потенциал LLM, индивидуальные пользователи уже активно используют их в своей повседневной жизни.
Как использовать LLM с максимальной пользой
Чтобы извлечь максимум из возможностей LLM, можно:
Создавать виртуальные команды: Использовать LLM в роли различных специалистов для проведения мозговых штурмов и принятия решений. Главное не забывать проверять.
Анализировать обратную связь: Быстрее обрабатывать отзывы клиентов или комментарии, чтобы выявлять основные темы и проблемы и сразу приступать к решениям.
Автоматизировать рутинные задачи: Настраивать LLM для выполнения повторяющихся задач, таких как составление отчетов или ответов на типовые запросы.
Важно помнить, что, несмотря на мощные возможности, LLM не заменяют полностью человеческий опыт и интуицию. Они служат инструментом, который при правильном использовании может значительно повысить эффективность и качество работы.
Вывод: LLM предоставляют уникальные возможности для индивидуальных пользователей, позволяя им выполнять задачи, которые ранее требовали специализированных знаний или ресурсов. Пока крупные организации только начинают осваивать этот инструмент, у каждого есть шанс использовать его для личного и профессионального роста.
P.S.
Если выжимка из эссе оказалось полезным — подписывайтесь на мой Телеграм-канал. Там больше кейсов, разборов инструментов и честных инструкций (без хайпа) по работе с нейросетями для жизни и бизнеса.
Пушкину теперь уже никогда не оправиться от такого позорного поражения нейросетью (сарказм, если что)
Конечно! Вот улучшенная версия Вашего стихотворения:
У лукоморья дуб стоит могучий,
Златая цепь сверкает на ветвях.
И день и ночь, как страж, неутомимый,
Кот ученый бродит по цепям в мечтах.
Если Вам нужно что-то конкретное изменить или добавить, дайте знать!
Актуальные модели ChatGPT от Open AI - разбираем все по полочкам. Почему o3 и o4-mini-high устарели?
Ребят, не буду грузить вас графиками, итак в посте много чисел, знаю многие такое не любят, но информация стоящая. OpenAI выпустили сразу много крутых моделей, чем наделали шума. Всего 3 новые модели: GPT‑4.1, GPT‑4.1 mini и GPT‑4.1 nano - я по-порядку расскажу
1) ChatGPT 4.1.
Это новая серия моделей GPT. Отличается тем, лучше всех работает с кодом и в целом, серия более ориентирована на разработчиков и кодеров. Сначала модели вышли по api, а в итоге все равно попали в интерфейс ChatGPT.
Кстати, вам возможно будет интересна моя статья ChatGPT 4.1 и добавили в интерфейс ChatGPT. Как выбрать из многообразия моделей
Теперь, как и в Gemini Pro контекстное окно - 1 миллион токенов, причем улучшено понимание длинного контекста
Появилась первая нано-модель
Обновлена база знаний - июнь 2024 года.
Модели ChatGPT 4.1. дешевле
Вот гайд для правильного составления запросов для ChatGPT 4.1 !
2) GPT‑4.1 mini и GPT‑4.1 nano.
GPT‑4.1 nano — самая быстрая и самая дешевая модель из доступных. Они существенно лучше GPT‑4o и GPT‑4o mini, особенно в следовании инструкциям и кодировании, в кодированиии он и ChatGPT 4.5 обошел.
3) Что же стало с моделями o3 и o4-mini ?
Итак, модели o3 и o4-mini - были самые умные модели раньше в ChatGPT в контексте глубокого размышления. Что на деле?
Модели o3 и o4-mini-high действительно показывают очень высокие результаты в reasoning-задачах — особенно в пошаговой логике, математике, программировании. Они дольше «думают», потому что более скрупулёзно обрабатывают информацию, и часто выдают более точные и «вдумчивые» ответы. Многие считают их лучшими именно в логических задачах внутри ChatGPT.
! Но:
GPT-4o — самая новая и флагманская модель. Она не хуже в reasoning, а в некоторых тестах даже лучше. К тому же, она:
быстрее,
дешевле в API,
мультимодальна (обрабатывает голос, текст, изображения),
и доступна в бесплатной версии ChatGPT.
Поэтому на данный момент (22 мая 2025 года) в контексте глубоких рассуждений - reasoning, ChatGPT-4o хоть и максимально универсальная, но reasoning у неё на том же или выше уровне, чем в моделях модели o3 и o4-mini, но работает она быстрее.
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
В целом, эти модели устарели, потому что в зависимости от конкретной задачи могут быть более подходящие модели, такие как GPT-4.1 для программирования или GPT-4o для мультимодальных задач. GPT-4.5 — как экспериментальная/исследовательская версия, она выдает очень "человечные" результаты.
Другое дело, что все упирается в лимиты- бесплатные и платные.
Хотите больше пользы? Добро пожаловать в Закрытый клуб:
____
Отдельно:
А если вам не хочется заморачиваться, в боте Syntx -- это мини приложение в телеграм, есть все популярные модели в единой подписке, и их можно оплатить русской картой. - Процесс я показала на примере создания Нейрофотосессии со своим лицом
ТОПОВЫЙ 20К АПСКЕЙЛЕР
ClarityAI увеличивает фото до 20 000 × 20 000 пикселей, а это 4️⃣0️⃣0️⃣ мегапикселей!
Что умеет:
🟣 Качество выше, чем видит глаз.
🟣 Размер — как 12 экранов 8К в одном изображении.
🟣 Идеален для гигапанорам, печати и детализации.
А главное, что юзать можно бесплатно.
Запускаем прямо в браузере: replicate.com/philz1337x/clarity-upscaler-large
📱 Код на GitHub: github.com/philz1337x/clarity-upscaler
Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ

