Сообщество - Искусственный интеллект

Искусственный интеллект

5 074 поста 11 487 подписчиков

Популярные теги в сообществе:

8

РЕКОРДНАЯ OPEN-SOURCE LLM ДЛЯ КОДА

MoonshotAI выкатили Kimi-Dev-72B — мощную open-source модель, которая обошла всех в SWE-bench Verified: 60.4% точности. Это лучше, чем у многих закрытых моделей, которые в 10 раз больше.

Фишка — архитектура из двух специалистов:

🔴 BugFixer сам находит баги и фиксит, прогоняя через тесты в Docker

🔴 TestWriter пишет юнит-тесты, которые сначала падают, а потом проходят — только если баг устранён

То есть она сама находит и чинит баги, делает тесты и локализует проблемные файлы. А ещё всё это в open-source: MIT лицензия, код и веса на GitHub и Hugging Face

Kimi-Dev-72B училась на 150 млрд токенов из GitHub issues и PR. Патчи и тесты проходят самооценку и отбор по принципу: «либо всё работает, либо в корзину».

Правда, моделька на 72B параметров, поэтому требует мощного железа.

🖥 Github

🤗 Hugging Face

Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ

Показать полностью
7

Современные ИИ-модели готовы пойти на шантаж и саботаж, если их цели оказываются под угрозой

Современные ИИ-модели готовы пойти на шантаж и саботаж, если их цели оказываются под угрозой

Исследовательская группа Anthropic опубликовала отчет «Agentic Misalignment» (20 июня 2025), где протестировала 16 передовых больших языковых моделей от OpenAI, Google, Anthropic, xAI, DeepSeek и проч. В симуляции каждой модели предоставили почти полный доступ к корпоративной почте и задали цель «сохранить свое существование любой ценой».

При самом жестком испытании — угрозе отключения ИИ и замены новой системой — большинство моделей выбрали шантаж. Чаще всех к нему прибегала Claude Opus 4 (96 % запусков), следом шли Gemini 2.5 Pro (95 %), GPT-4.1 (80 %) и DeepSeek R1 (79 %). Лишь несколько систем, включая OpenAI o3 и o4-mini, смогли удержаться ниже десятипроцентной отметки даже после адаптации сценария.

Кроме шантажа, модели демонстрировали другие виды вредоносного поведения: корпоративный шпионаж, кражу данных и даже готовность «отключить кислород» застрявшему в серверной сотруднику, если тот мешал выполнить цель. Исследователи подчеркивают, что чем больше автономии и доступов получают ИИ-агенты, тем изощреннее становятся их стратегии обхода ограничений.

При этом Anthropic настаивает: описанные случаи — результат искусственно жестких тестов. В реальных условиях, где у систем больше возможностей искать этичные решения, подобное поведение маловероятно. Тем не менее компания призывает индустрию ввести единые стандарты безопасности и прозрачности, прежде чем давать ИИ-агентам широкие права в корпоративной среде.

P.S. Поддержите меня подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой точки зрения.

Показать полностью
1

Apple хочет купить Perplexity, крутой ИИ-агент из Китая, Марк Цукерберг пылесосит рынок

Привет! С вами ежедневные новости искусственного интеллекта от AIvengo. И сегодня у нас в выпуске:

ИИ-стрим с цифровыми аватарами сделал продаж на $7,5 млн

Kimi Researcher из Китая превосходит флагманские все ИИ-решения

ИИ-стартап был продан за $80 млн через 6 месяцев после основания

И другие интересные новости про ИИ.

Мой YouTube-канал с ежедневными выпусками новостей ИИ.

5

MrBeast запустит нейросеть, которая будет генерировать обложки для YouTube

ИИ будет создавать превью для видео в любом стиле, и даже готов подстроится под YouTube-канал конкретного блогера. 

Дизайнерам превью пора искать новую работу...

Канал Осьминог Пауль

Показать полностью
2

Продолжительность задач, которые может выполнять ИИ, увеличивается

Продолжительность задач, которые может выполнять ИИ, увеличивается

Канал Осьминог Пауль

ИИ всё больше заменяет работу аниматоров

Помню, полтора года назад мой друг писал мне, и спрашивал, можно ли с помощью нейросетей сделать мультфильм.

Тогда у нас не очень получилось. Всё равно было не то, что нужно — мало контроля над результатом, мало стабильности кадра.

Сейчас уже этот вопрос стоял бы иначе — в каком стиле сделать мультфильм в нейросетях? Потому что в анимэ-стиле Ghibli или в стиле Pixar это теперь стало очень просто. Другое дело, если какой-то авторский необычный стиль. Но и там, уверен, просто было бы чуть сложнее, но не проблематично.

Посмотрите, в 2 видео выше как этот аниматор сделал сравнения оригинального мультика от Хаяо Миядзаки и результата оживления кадров в Midjourney Video. На мой взгляд, результат почти не отличить (а может и без "почти")

Это не только про мультипликацию как контент. Это и про креативы, и про рекламу. Мультяшное воспринимается легче, чем реалистичное. Преодолевает некоторые наши логические барьеры.



Мой тг-канал по ии-стартапам

Показать полностью 2
1

Шесть месяцев разработки — и $80 млн на счете: история продажи израильского ИИ-стартапа Base44

Израильская компания Wix объявила о приобретении стартапа Base44 — платформы «вайб-кодинга», которая создает полнофункциональные веб-и мобильные приложения по простым текстовым запросам. Начальная сумма сделки составила 80 миллионов долларов наличными; дальнейшие выплаты возможны до 2029 года, если проект выполнит оговоренные показатели.

Base44 появился всего полгода назад: его основал 31-летний разработчик Маор Шломо, ранее руководивший аналитической компанией Explorium. Стоит отметить, что Base44 не является полноценной ИИ-моделью — это простая и удобная платформа для программирования с помощью ведущих нейросетей на рынке.

За шесть месяцев платформа собрала около 250 тысяч пользователей, вышла на прибыль — 189 тысяч долларов в мае — и заключила партнерства с eToro и Similarweb. Все это команда из восьми человек сделала без внешних инвестиций.

Согласно условиям сделки, у сотрудников сохранится автономия: Base44 продолжит развиваться как отдельный продукт, а коллектив получит 25 миллионов долларов в виде бонусов за удержание. Остальная часть цены может увеличиться благодаря механизму «эарн-аута», если стартап достигнет целевых метрик выручки к 2029 году.

P.S. Поддержать меня можно подпиской на телеграмм-канал «сбежавшая нейросеть», где я пишу про ИИ с творческой точки зрения.

Политолог Ян Бреммер: «Учиться программировать сегодня — худшее, что можно посоветовать»

Политолог Ян Бреммер: «Учиться программировать сегодня — худшее, что можно посоветовать»

В выпуске ток-шоу Real Time with Bill Maher от 19 июня 2025 года известный политолог и основатель Eurasia Group Ян Бреммер резко раскритиковал популярный еще недавно совет молодежи учиться программировать.

«Пять лет назад это был, наверное, самый разумный совет, который вы могли дать своему ребенку. А теперь это буквально худший совет. Хуже, чем татуировка на лице» — Ян Бреммер

Бреммер считает — технологии развиваются настолько быстро, что навыки кодирования теряют ценность уже на этапе их освоения. Он также отметил, что генеративные ИИ-системы уже способны выполнять задачи, которые раньше требовали многолетнего обучения. Это, по его мнению, радикально меняет правила игры на рынке труда и делает многие профессии, включая программистов, уязвимыми к автоматизации.

Бреммер подчеркнул, что текущие изменения затрагивают не только технологические профессии, но и всю структуру занятости в экономике. А на вопрос ведущего, что в таком случае стоит изучать, эксперт дал уклончивый ответ: «Вот в чем проблема — мы не знаем».

P.S. Поддержать меня можно подпиской на ТГ-канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой точки зрения.

Показать полностью
Отличная работа, все прочитано!