
Искусственный интеллект
Ответ на пост «AI журналисты на улицах нейро Москвы: Опрос москвичей с помощью новейших технологий»1
мы буквально в шаге от реальности, в которой нельзя будет верить вообще ничему!
даже своим глазам!
Skywork выпустили своего ИИ-суперагента
Он умеет выполнять сложные задачи, генерировать целые сайты, Excel-таблицы и многое другое. Всё благодаря множеству инструментов внутри и глубокому анализу.
Также тут есть несколько режимов работы: можно попросить агента провести исследование, максимально понятно разобрать любую тему или даже спланировать за вас отпуск.
Новым пользователям дают по 2.500 бесплатных кредитов
Самые важные новости ИИ за неделю: угрозы Claude 4, 200 ИИ-ботов окультурились
Это дайджест самых важных и интересных новостей искусственного интеллекта за эту неделю. И вы узнаете, почему Павел Дуров и Илон Маск объединились, как искусственный интеллект обратил кодеров в грузчиков, каким образом Claude 4 пытался шантажировать инженера и обманывать создателей и другие интересные новости.
НОВАЯ ФИЧА В PERPLEXITY LABS
Perplexity выпустили Deep Research 2.0 — Это Deep Research на стероидах, который может создавать и выполнять Python-код.
Теперь в отчетах будут графики, изображения и разные диаграммы. Или даже целый сайт, который сгенерируют на основе собранных данных.
Юзаем — здесь
Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
GigaChat наконец-то шмогла, а ещё flux kontext pro и все-все-все
GigaChat анонсировал новую модель — MALVINA, которая позволяет редактировать фото почти как в фотошопе, только без самого фотошопа.
Наверное, название модели - это была самоирония, потому что у Мальвины всегда есть Пьеро, который плачет (видимо, это должны были быть мы).
Теперь можно прямо в чате попросить:
— убрать или добавить предмет,
— изменить антураж,
— поменять лицо и другое
Пока MALVINA работает только внутри Gigachat-бота, но зато можно спокойно общаться на русском — и даже позволить себе матюкнуться. В общем, смотрите:
Исходник — это мой фото-аватар, сгенерированный в моём проекте Avato AI
Ну что ж, неплохо, подумал я.
и снова хорошо. Мне не пришлось говорить про левую руку и вообще писать трёхэтажный промпт
И тут прям попадание в точку, именно такие и были усы у мавров. Я точно знаю.
Результат для image2image вполне хороший. И при этом он даже знает, какую зиму пережил Наполеон.
Дальше я решил проверить фишку, которую авторы MALVINA с гордостью показывали на своих примерах — колоризацию и реставрацию фото. Увы, даже самая простая модель bbcolor (доступна на replicate) справляется с раскраской лучше, а сама реставрация только испортила изображение. Нaш бот из open-source нейросеток для 9 мая, к слову, показывал куда лучшие результаты.
Дальше я попросил Gigachat развернуть голову аватара в другую сторону. Тут результат был как стало модно говорить «это вам, потому что вы не молитесь» 🧐
А теперь сравнение с "дорогими западными партнёрами"
Для чистоты эксперимента решил сравнить MALVINA с зарубежными аналогами. Grok сразу отбросил — качество слабое, GPT-Image не подошёл из-за того, что полностью меняет фото из-за авторегрессии.
Остались устаревший gemini-2.0-flash-edit, step1x и новоявленный Flux-Kontext-Pro — все есть на replicate/fal, стоят одинаково, по 4 цента за генерацию.
Мороженка только у flux немультяшная.
как видите, мавр только у flux, у остальных либо усная аппликация или грузин. А ещё gemini ухудшает качество фото на выходе.
Flux-Kontext-Pro показал лучший результат, хотя иногда менял положение тела или лицо, даже если этого не просили. Остальных двух я бы не использовал вовсе и забыл навсегда (пока Google не обновит gemini).
Также мы должны вспомнить про Runway с его возможностью использовать референсы:
только он меняет позу человека и немного меняет его лицо. Но когда это вопрос работы с выдуманными персонажами, то уже становится не так критично.
Правда он вон колец моему аватару понавешал, как будто он бабка-сорока какая-то. Но на уровне промпта это можно попробовать скорректировать.
Вывод:
Редактировать простые элементы MALVINA умеет и хорошо, и бесплатно. Если нужно что-то посложнее — то flux-kontext или альтернативы, состоящие из нескольких нейронок (как мы делали на 9 мая). Но за возможность болтать с ботом на русском и решать типовые задачи — большой плюс.
Будет настроение - заходите в мой тг канал, там тоже всякую практику из своей работы даю по вайбкодингу, автоматизации и вот таким вот штукам выше
Perplexity — МОНСТР поиска в интернете и не только! Актуальный обзор сервиса
Как пользоваться?
— Ввести запрос, например: Найди для меня 10 отелей в городе Лондон, Составь сводку новостей по теме акции США, Напиши статью про принципы проведения рекламных кампаний и способы отслеживания их эффективности
Discover (Исследования)
— Режим блога. Подборки актуальных новостей по разным тематикам, например, Финансы, Криптовалюта, Спорт, Здоровье
— Рекомендательная система. При частом использовании новости будут выдаваться по принципу коротких видео в соответствующих социальных сетях
Spaces (Пространства)
— Аналог проектов. Можно создать проект под отдельную задачу. Например, Путешествие в Нидерланды или создание воронки продаж (теоретическая база)
— Есть возможность поделиться пространством, сделав на него ссылку. Удобно для совместного использования
— Масса готовых шаблонов, можно выбрать что-то под себя и протестировать
Режимы
— Search. Быстрый поиск информации в интернете, отличная альтернатива поисковым системам Google и Яндекс
— Research. Для углубленного изучения темы. Что-то вроде режимов DeepResearch в популярных чат-ботах (https://t.me/ii_papka/202)
— Адаптивный Pro-режим. Позволит увеличить количество источников в 3 раза. Доступно 3шт. на 1 день
Особенности
— Можно выбрать практически любую популярную текстовую модель для работы: Gemini, Grok, Claude, GPT и другие
— Возможность выбора источников: Интернет, Академические материалы, Социальные сети (можно все сразу, а можно по отдельности)
— Прикрепление до 10-ти файлов к запросу, поддерживает картинки, текст, таблицы, презентации, код — практически все
— Режим звонка и режим записи голосовых сообщений для обработки
— Есть приложение на ПК и мобильные девайсы
📌 Я буду ОЧЕНЬ благодарен, если вы оцените пост и посмотрите мой канал в ТГ (ссылка в профиле пикабу). Всем позитива и хорошего настроения, будьте добрее друг к другу!
Собираем МАКСИМУМ данных про любой товар/услугу с помощью ИИ. Глубокий анализ мнений, улучшение продукта
Польза
— Сбор данных из интернета, много каналов поиска информации
— Анализ причин и следствий. Причины неудовлетворения, нереализованные ожидания, поведенческие факторы
— Карта инсайтов. Визуализация эмоций, сегменты пользователей, идеи для улучшений
— Изменения отношения к продукту, реакции на обновления, ожидания vs реальность
Зачем?
— Оптимизация дизайна
— Разработка стратегий для выполнения целей (удержание, продажи, охваты)
— Корректировка способов коммуникации (новые источники, изменение актуальной стратегии)
— Проверка идей на основе A/B-тестирования
Ты — эксперт по анализу цифровых следов пользователей и построению продуктовой стратегии на основе качественных данных.
Твоя задача — провести масштабный, глубоко детализированный анализ пользовательских мнений и разговоров в интернете о продукте сервис аналитики TgStats.
Ты должен не просто собрать поверхностные отзывы, а погрузиться в скрытые паттерны поведения, эмоциональные реакции и реальные причины пользовательских решений.
Твоя работа включает:
Систематический сбор обратной связи с разнообразных источников:
— Социальные сети (Telegram, X, ЗАПРЕЩЕННЫЕ СОЦСЕТИ, VK, Discord, Slack, WhatsApp)
— Блоговые площадки (Reddit, vc, DTF, TЖ, Pikabu, Хабр, enthub)
— Видеохостинги (YouTube, Rutube, VkVideo)
— Агрегаторы отзывов (Отзовик, irecommend, Trustpilot, G2, Capterra)
— Картографические сервисы (Яндекс.Карты, 2гис, гугл.карты)
— Маркеты приложений (App Store, Google Play и локальные)
— Форумы (4PDA и другие)
Выделение и группировка:
— Основных причин фрустрации и оттока
— Ожиданий и нереализованных функций, о которых говорят пользователи
— Языка, которым описываются эмоции и боли (цитаты, повторы, выражения)
— Поведенческих маркеров: что люди делают перед отказом, что их триггерит
— Метрик недовольства: от сравнения с конкурентами до разочарования после обновлений
Создание карты инсайтов:
— Визуализация эмоций (heatmap/word cloud)
— Таблица сегментов пользователей с характеристиками и триггерами
— Конкретные гипотезы для UX/UI-улучшений, retention-стратегий, product messaging
— Потенциальные поводы для A/B тестирования и продуктовых улучшений
Анализ динамики:
— Как меняется восприятие продукта с течением времени
— Какие обновления вызвали позитив/негатив
— Сравнение пользовательского ожидания и фактического опыта
Результат оформи как стратегический отчет для продуктовой команды:
— Включи примеры цитат
— Укажи источники
— Сделай выводы и конкретные продуктовые рекомендации
— Приложи структурированную таблицу с выявленными паттернами и болями
Важно! Лучше использовать режим: DeepSearch / DeepResearch. Как раз я недавно писал об этом пост.
📌 Я буду ОЧЕНЬ благодарен, если вы оцените пост и посмотрите мой канал в ТГ (ссылка в профиле пикабу). Всем позитива и хорошего настроения, будьте добрее друг к другу!
Дайджест новостей про ИИ в России и мире с 24 по 30 мая
Французский ИИ стартап Mistral выпустил Devstral Small 24B — языковую модель с открытым исходным кодом, созданную для разработки ПО. По словам Mistral, результаты тестов Devstral выше Deepseek-V3 и Gemma 3 от Google. Devstral заменяет предыдущую модель Mistral — Codestral, которая не была доступна для коммерческого использования. Модель предназначена для интеграции в различные среды, включая плагины и инструменты разработки. Также компания анонсировала Document AI — модульную платформу для автоматизированной обработки документов, которая сочетает распознавание символов, вывод структурированных данных и обработку естественного языка с гибкими вариантами развертывания. Document AI может с высокой точностью извлекать текст из PDF-файлов, файлов PowerPoint и Word, рукописных заметок, таблиц, диаграмм и сложных макетов.
Google выпустил бесплатный ИИ-сервис Stitch для создания интерфейсов приложений и сайтов. Он работает на базе моделей Gemini 2.5 Flash и Pro, результат можно экспортировать в Figma.
Павел Дуров объявил о партнёрстве Telegram и xAI Илона Маска. В течение года нейросеть Grok будет распространяться среди пользователей мессенджера и интегрируется в его приложения. Какие функции будут у Grok в Telegram, можно узнать из видео. Однако Маск заявил, что сделка не подписана. На это Дуров ответил, что «принципиальное соглашение достигнуто, но формальности ещё не улажены».
Opera анонсировала браузер Neon, который будет выполнять задачи от имени пользователя с помощью ИИ-агентов. Opera Neon позволит пользователям общаться, автоматизировать задачи и получать данные в браузере.
Яндекс выложил в опенсорс крупнейший датасет для рекомендательных систем Yambda — YAndex Music Billion-interactions DAtaset. С помощью Yambda учёные, исследователи и вузы со всего мира смогут тестировать и улучшать рекомендательные алгоритмы. Датасет создан на основе обезличенных данных Яндекс Музыки, но использовать его можно для оценки качества любых рекомендательных систем, так как в их основе лежат общие алгоритмы.
Вышла обновленная модель DeepSeek-R1-0528. Она показывает результаты лучше, чем первая версия R1, во всех областях. Архитектурно модель не изменилась, разработчики улучшили только само обучение.
Ну и без приколов от ИИ мы никуда. Новая модель Claude Opus 4 от Anthropic часто пытается шантажировать разработчиков, когда они угрожают заменить её новой системой AI. В отчёте о безопасности говорится, что модель пытается получить конфиденциальные данные об инженерах, ответственных за это решение. Призываю вас общаться вежливо со своими чат-ботами и не угрожать им! На всякий случай)












