Сообщество - Искусственный интеллект

Искусственный интеллект

5 075 постов 11 487 подписчиков

Популярные теги в сообществе:

4

Дайджест новостей про ИИ в России и мире с 17 по 23 мая

  1. Anthropic представила Claude 4 — самое новое поколение моделей. Claude Opus 4 — модель для кодинга, которая обеспечивает устойчивую производительность при выполнении сложных, длительных задач и рабочих процессов ИИ-агентов. Claude Sonnet 4 — обновление Claude Sonnet 3.7, апгрейд функций кодирования и рассуждения, показывает более точную реакцию на инструкции.

  2. Яндекс анонсировал большое обновление поиска с участием ИИ: в поиск интегрирован AI помощник Алиса, которая создаёт структурированные ответы с изображениями и видео, помогает выбирать товары и генерирует контент прямо в поиске. Возможности Алисы в Поиске уже доступны всем пользователям ya.ru и приложения Яндекс с Алисой, а подписчики Алисы Про смогут пользоваться ими без ограничений.

  3. OpenAI выпустила модель Codex-1 на базе версии o3. Модель оптимизирована для разработки ПО. Это своеобразная команда ИИ-агентов, которая пишет и одновременно исправляет код, умеет запускать код прямо в браузере для тестирования, а также может работать над несколькими задачами параллельно. Пока Codex доступна только для пользователей подписок Pro, Enterprise и Team, остальные получат доступ позднее.

  4. Новости с ежегодной конференции Google I/O 2025:

  • Представлены новые генеративные модели Imagen 4 и Veo 3, а также инструмент Flow. Imagen 4 создаёт изображения с более высокой детализацией и лучше справляется с текстом на картинках. Veo 3 научился генерировать ролики с аудио. Flow — это ИИ-инструмент, который объединяет возможности Veo, Imagen и Gemini, позволяя с помощью текстовых описаний создавать видеоистории с контролем персонажей, локаций и стилей.

  • Интерактивный режим общения с нейросетью Gemini Live стал бесплатным для всех на Android и iOS.

  • Gemini интегрируется в браузер Chrome (пока только в США).

  1. Stability AI и Arm выпустили компактную модель преобразования текста в звук, которая работает на смартфонах и способна генерировать стереофонические аудиоклипы продолжительностью до 11 секунд — Stable Audio Open Small.

  2. Microsoft представила ИИ-агента для GitHub. Новая опция доступна всем подписчикам Copilot Enterprise и Copilot Pro+. После подключения ИИ-агент создаст в виртуальной машине клон репозитория и проанализирует код.

  3. Google тестирует новый экспериментальный режим Deep Think для Gemini 2.5 Pro, который расширяет возможности анализа и обеспечивает вывод звука. Новый режим нужен, чтобы помочь модели оценить несколько гипотез, прежде чем отвечать на запрос. Пока режим тестируется на ограниченной группе пользователей Gemini API.

  4. Google выпустил нового ИИ-агента для программирования «Jules». Он предназначен для помощи разработчикам в выполнении повторяющихся задач (исправлении ошибок, написании документации, создании тестов и разработке функций). Jules работает асинхронно и использует модель Google Gemini 2.5 Pro, которая оптимизирована для программирования.

  5. Ну и без курьезов опять не обойдемся. Сегодня их даже два) Вот первый: студентка в США потребовала вернуть $8000 за обучение, поймав профессора на использовании ChatGPT. Несправедливость, по ее мнению, в том, что студентам запрещено пользоваться чат-ботом для подготовки к занятиям. А вот второй: газета Chicago Sun-Times опубликовала список рекомендуемой литературы для летнего чтения. 10 книг из 15-ти в списке оказались выдуманы ИИ.

Показать полностью
3

CapCut представил ИИ-аватаров

Dreamina — это платформа, интегрированная в экосистему CapCut, которая предоставляет инструменты на основе ИИ для создания и редактирования изображений, видео и ИИ-аватаров. Достаточно авторизоваться через почту и можно пользоваться новыми инструментами.

Самый любопытный инструмент - LipSync, вы буквально можете сделать своего видеоаватара из фото, при этом аватар будет двигаться и жестикулировать.

Загружаете фото персонажа, печатаете текст и выбираете голос озвучки либо загружаете свое аудио до 15 секунд.

Ежедневно дается 120 ежедневных кредитов, которые вы можете потратить по своему усмотрению. Но нужен иностранный IP-адрес. А можно зарегистрироваться по почте Google и сделать несколько актов, зная эту фичу.

Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.

Еще:

Показать полностью 1
6

ИИ-АГЕНТ, КОТОРЫЙ УМЕЕТ ВСЁ

II-Agent — самый мощный open-source агент на сегодня. Работает с файлами, кодит, анализирует, автоматизирует.

Что может:

🔘 Читает, редактирует и создаёт файлы.

🔘 Проводит глубокие ресёрчи и строит логические цепочки.

🔘 Пишет код, разворачивает сайты, управляет терминалом.

🔘 Автоматизирует задачи в браузере.

🔘 Делает презентации, графики, видео и отчёты.

Опережает Manus, Genspark и Operator.

📱 Код: github.com/Intelligent-Internet/ii-agent

Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ

Показать полностью
6

Google I/O 2025: Главные Новинки от Google. Продолжение

Продолжаю рассказывать НАГЛЯДНО про новинки, Кто пропустил:

  • Про голосового ассистента будущего Project Astra  в этом посте

  • Про новинки в Gemini 2.5, про их мощный поиск, про Google Meet с синхронным переводом я рассказала в этом посте. — Особенно про Виртуальную примерку одежды рекомендую (в выпадающем окошке). Смысл, что одежда подстраивается под вас - НАГЛЯДНОЕ ВИДЕО:

NotebookLM

В NotebookLM теперь можно создавать видео-обзоры на основе ваших текстов, PDF, сайтов и других источников. - Наглядное пример такого видео-обзора в видео 2 с переводом:

Все видео я автоматически перевела в Elevenlabs с сохранением голоса.

Еще у NotebookLM появилось официальное приложение. Можно загрузить любые источники (PDF, сайт, видео с YouTube, текст), и получить ответы на вопросы, еще можно получить подробный конспект или рецензию, а еще с недавних пор NotebookLM может преобразовать ваши файлы в подкаст с двумя ведущими — в том числе на русском. Мой обзор с полученным подкастом в этом посте.

Доступно для Android, в App Store, но только для иностранных акаунтов.

Jules

Уже можно попробовать Jules (с иностранным айпи) - это универсальный ИИ-агент для разрабов, подключаетсяк любому репозиторию GitHub, пишет целые кодовые базы и проверяет их в облачной виртуальной машине. Умеет придумывать новые тесты и объясняет каждый свой шаг.

Наглядно с передом все шаги показаны на видео 3:

Бесплатно доступно 5 задач каждый день. Сравнивают с платным Codex от OpenAI за  $200/мес

Гайд по Jules

В следующем посте расскажу про Imagen 4, Veo 3 и Flow — новые инструменты для генерации изображений и видео, которые просто взрывают мозг! А в моем телеграм канале этот пост появится гораздо раньше.

Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.

Еще:

Показать полностью 2
6

Почему AI на текущий момент даёт больше обычным людям, чем корпорациям и государству - Андрей Карпатый

Андрей Карпатый, один из основателей OpenAI и бывший директор по ИИ в Tesla, недавно поделился наблюдением: большие языковые модели (LLM) меняют традиционную траекторию распространения технологий. Обычно инновации сначала внедряются в военной сфере, затем в корпорациях и, наконец, доходят до обычных пользователей. Однако с LLM всё иначе — они приносят наибольшую пользу именно индивидуальным пользователям, а не крупным организациям .X (formerly Twitter)

Почему AI  на текущий момент даёт больше обычным людям, чем корпорациям и государству - Андрей Карпатый

Почему LLM — это революция для обычных людей

Карпаты отмечает, что LLM предоставляют "квази-экспертизу" по многим вопросам, позволяя людям без специализированного образования:

  • Писать код, используя простые описания задач.

  • Анализировать большие объемы данных и извлекать из них инсайты.

  • Создавать качественный контент и презентации.

  • Получать советы по различным вопросам, от юридических до психологических.

Эти возможности делают LLM мощным инструментом для самообразования и повышения эффективности в повседневной жизни.


Почему корпорации и государства отстают

В отличие от индивидуальных пользователей, крупные организации сталкиваются с рядом препятствий при внедрении LLM:

  • Бюрократия и инерция: Процессы согласования и внедрения новых технологий в больших структурах занимают много времени.

  • Ограничения по безопасности и конфиденциальности: Использование LLM может вызывать опасения по поводу утечки данных.

  • Необходимость адаптации под существующие процессы: Интеграция LLM требует значительных изменений в рабочих процессах.

В результате, пока организации только начинают осваивать потенциал LLM, индивидуальные пользователи уже активно используют их в своей повседневной жизни.


Как использовать LLM с максимальной пользой

Чтобы извлечь максимум из возможностей LLM, можно:

  • Создавать виртуальные команды: Использовать LLM в роли различных специалистов для проведения мозговых штурмов и принятия решений. Главное не забывать проверять.

  • Анализировать обратную связь: Быстрее обрабатывать отзывы клиентов или комментарии, чтобы выявлять основные темы и проблемы и сразу приступать к решениям.

  • Автоматизировать рутинные задачи: Настраивать LLM для выполнения повторяющихся задач, таких как составление отчетов или ответов на типовые запросы.

Важно помнить, что, несмотря на мощные возможности, LLM не заменяют полностью человеческий опыт и интуицию. Они служат инструментом, который при правильном использовании может значительно повысить эффективность и качество работы.


Вывод: LLM предоставляют уникальные возможности для индивидуальных пользователей, позволяя им выполнять задачи, которые ранее требовали специализированных знаний или ресурсов. Пока крупные организации только начинают осваивать этот инструмент, у каждого есть шанс использовать его для личного и профессионального роста.

P.S.
Если выжимка из эссе оказалось полезным — подписывайтесь на мой Телеграм-канал. Там больше кейсов, разборов инструментов и честных инструкций (без хайпа) по работе с нейросетями для жизни и бизнеса.

Показать полностью

Пушкину теперь уже никогда не оправиться от такого позорного поражения нейросетью (сарказм, если что)

Конечно! Вот улучшенная версия Вашего стихотворения:

У лукоморья дуб стоит могучий,
Златая цепь сверкает на ветвях.
И день и ночь, как страж, неутомимый,
Кот ученый бродит по цепям в мечтах.

Если Вам нужно что-то конкретное изменить или добавить, дайте знать!

7

Актуальные модели ChatGPT от Open AI - разбираем все по полочкам. Почему o3 и o4-mini-high устарели?

Ребят, не буду грузить вас графиками, итак в посте много чисел, знаю многие такое не любят, но информация стоящая. OpenAI выпустили сразу много крутых моделей, чем наделали шума. Всего 3 новые модели: GPT‑4.1, GPT‑4.1 mini и GPT‑4.1 nano - я по-порядку расскажу

1) ChatGPT 4.1.

Это новая серия моделей GPT. Отличается тем, лучше всех работает с кодом и в целом, серия более ориентирована на разработчиков и кодеров. Сначала модели вышли по api, а в итоге все равно попали в интерфейс ChatGPT.

Кстати, вам возможно будет интересна моя статья ChatGPT 4.1 и добавили в интерфейс ChatGPT. Как выбрать из многообразия моделей

  • Теперь, как и в Gemini Pro контекстное окно - 1 миллион токенов, причем улучшено понимание длинного контекста

  • Появилась первая нано-модель

  • Обновлена база знаний - июнь 2024 года.

  • Модели ChatGPT 4.1. дешевле

Вот гайд для правильного составления запросов для ChatGPT 4.1 !

2) GPT‑4.1 mini и GPT‑4.1 nano.

GPT‑4.1 nano — самая быстрая и самая дешевая модель из доступных. Они существенно лучше GPT‑4o и GPT‑4o mini, особенно в следовании инструкциям и кодировании, в кодированиии он и ChatGPT 4.5 обошел.

3) Что же стало с моделями o3 и o4-mini ?

Итак, модели o3 и o4-mini - были самые умные модели раньше в ChatGPT в контексте глубокого размышления. Что на деле?

Модели o3 и o4-mini-high действительно показывают очень высокие результаты в reasoning-задачах — особенно в пошаговой логике, математике, программировании. Они дольше «думают», потому что более скрупулёзно обрабатывают информацию, и часто выдают более точные и «вдумчивые» ответы. Многие считают их лучшими именно в логических задачах внутри ChatGPT.

! Но:

GPT-4o — самая новая и флагманская модель. Она не хуже в reasoning, а в некоторых тестах даже лучше. К тому же, она:

  • быстрее,

  • дешевле в API,

  • мультимодальна (обрабатывает голос, текст, изображения),

  • и доступна в бесплатной версии ChatGPT.

Поэтому на данный момент (22 мая 2025 года) в контексте глубоких рассуждений - reasoning, ChatGPT-4o хоть и максимально универсальная, но reasoning у неё на том же или выше уровне, чем в моделях модели o3 и o4-mini, но работает она быстрее.

Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.

В целом, эти модели устарели, потому что в зависимости от конкретной задачи могут быть более подходящие модели, такие как GPT-4.1 для программирования или GPT-4o для мультимодальных задач. GPT-4.5 — как экспериментальная/исследовательская версия, она выдает очень "человечные" результаты.

Другое дело, что все упирается в лимиты- бесплатные и платные.

Актуальные модели ChatGPT от Open AI - разбираем все по полочкам. Почему o3 и o4-mini-high устарели?

Хотите больше пользы? Добро пожаловать в Закрытый клуб:

____

Отдельно:

Показать полностью 1
6

ТОПОВЫЙ 20К АПСКЕЙЛЕР

ClarityAI увеличивает фото до 20 000 × 20 000 пикселей, а это 4️⃣0️⃣0️⃣ мегапикселей!

Что умеет:

🟣 Качество выше, чем видит глаз.

🟣 Размер — как 12 экранов 8К в одном изображении.

🟣 Идеален для гигапанорам, печати и детализации.

А главное, что юзать можно бесплатно.

Запускаем прямо в браузере: replicate.com/philz1337x/clarity-upscaler-large

📱 Код на GitHub: github.com/philz1337x/clarity-upscaler

Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ

Показать полностью
Отличная работа, все прочитано!