
Искусственный интеллект
РЕКОРДНАЯ OPEN-SOURCE LLM ДЛЯ КОДА



MoonshotAI выкатили Kimi-Dev-72B — мощную open-source модель, которая обошла всех в SWE-bench Verified: 60.4% точности. Это лучше, чем у многих закрытых моделей, которые в 10 раз больше.
Фишка — архитектура из двух специалистов:
🔴 BugFixer сам находит баги и фиксит, прогоняя через тесты в Docker
🔴 TestWriter пишет юнит-тесты, которые сначала падают, а потом проходят — только если баг устранён
То есть она сама находит и чинит баги, делает тесты и локализует проблемные файлы. А ещё всё это в open-source: MIT лицензия, код и веса на GitHub и Hugging Face
Kimi-Dev-72B училась на 150 млрд токенов из GitHub issues и PR. Патчи и тесты проходят самооценку и отбор по принципу: «либо всё работает, либо в корзину».
Правда, моделька на 72B параметров, поэтому требует мощного железа.
🖥 Github
Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
Современные ИИ-модели готовы пойти на шантаж и саботаж, если их цели оказываются под угрозой
Исследовательская группа Anthropic опубликовала отчет «Agentic Misalignment» (20 июня 2025), где протестировала 16 передовых больших языковых моделей от OpenAI, Google, Anthropic, xAI, DeepSeek и проч. В симуляции каждой модели предоставили почти полный доступ к корпоративной почте и задали цель «сохранить свое существование любой ценой».
При самом жестком испытании — угрозе отключения ИИ и замены новой системой — большинство моделей выбрали шантаж. Чаще всех к нему прибегала Claude Opus 4 (96 % запусков), следом шли Gemini 2.5 Pro (95 %), GPT-4.1 (80 %) и DeepSeek R1 (79 %). Лишь несколько систем, включая OpenAI o3 и o4-mini, смогли удержаться ниже десятипроцентной отметки даже после адаптации сценария.
Кроме шантажа, модели демонстрировали другие виды вредоносного поведения: корпоративный шпионаж, кражу данных и даже готовность «отключить кислород» застрявшему в серверной сотруднику, если тот мешал выполнить цель. Исследователи подчеркивают, что чем больше автономии и доступов получают ИИ-агенты, тем изощреннее становятся их стратегии обхода ограничений.
При этом Anthropic настаивает: описанные случаи — результат искусственно жестких тестов. В реальных условиях, где у систем больше возможностей искать этичные решения, подобное поведение маловероятно. Тем не менее компания призывает индустрию ввести единые стандарты безопасности и прозрачности, прежде чем давать ИИ-агентам широкие права в корпоративной среде.
P.S. Поддержите меня подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой точки зрения.
Apple хочет купить Perplexity, крутой ИИ-агент из Китая, Марк Цукерберг пылесосит рынок
Привет! С вами ежедневные новости искусственного интеллекта от AIvengo. И сегодня у нас в выпуске:
ИИ-стрим с цифровыми аватарами сделал продаж на $7,5 млн
Kimi Researcher из Китая превосходит флагманские все ИИ-решения
ИИ-стартап был продан за $80 млн через 6 месяцев после основания
И другие интересные новости про ИИ.
Мой YouTube-канал с ежедневными выпусками новостей ИИ.
MrBeast запустит нейросеть, которая будет генерировать обложки для YouTube
ИИ будет создавать превью для видео в любом стиле, и даже готов подстроится под YouTube-канал конкретного блогера.
Дизайнерам превью пора искать новую работу...
Канал Осьминог Пауль
ИИ всё больше заменяет работу аниматоров
Помню, полтора года назад мой друг писал мне, и спрашивал, можно ли с помощью нейросетей сделать мультфильм.
Тогда у нас не очень получилось. Всё равно было не то, что нужно — мало контроля над результатом, мало стабильности кадра.
Сейчас уже этот вопрос стоял бы иначе — в каком стиле сделать мультфильм в нейросетях? Потому что в анимэ-стиле Ghibli или в стиле Pixar это теперь стало очень просто. Другое дело, если какой-то авторский необычный стиль. Но и там, уверен, просто было бы чуть сложнее, но не проблематично.
Посмотрите, в 2 видео выше как этот аниматор сделал сравнения оригинального мультика от Хаяо Миядзаки и результата оживления кадров в Midjourney Video. На мой взгляд, результат почти не отличить (а может и без "почти")
Это не только про мультипликацию как контент. Это и про креативы, и про рекламу. Мультяшное воспринимается легче, чем реалистичное. Преодолевает некоторые наши логические барьеры.
—
Мой тг-канал по ии-стартапам
Шесть месяцев разработки — и $80 млн на счете: история продажи израильского ИИ-стартапа Base44
Израильская компания Wix объявила о приобретении стартапа Base44 — платформы «вайб-кодинга», которая создает полнофункциональные веб-и мобильные приложения по простым текстовым запросам. Начальная сумма сделки составила 80 миллионов долларов наличными; дальнейшие выплаты возможны до 2029 года, если проект выполнит оговоренные показатели.
Base44 появился всего полгода назад: его основал 31-летний разработчик Маор Шломо, ранее руководивший аналитической компанией Explorium. Стоит отметить, что Base44 не является полноценной ИИ-моделью — это простая и удобная платформа для программирования с помощью ведущих нейросетей на рынке.
За шесть месяцев платформа собрала около 250 тысяч пользователей, вышла на прибыль — 189 тысяч долларов в мае — и заключила партнерства с eToro и Similarweb. Все это команда из восьми человек сделала без внешних инвестиций.
Согласно условиям сделки, у сотрудников сохранится автономия: Base44 продолжит развиваться как отдельный продукт, а коллектив получит 25 миллионов долларов в виде бонусов за удержание. Остальная часть цены может увеличиться благодаря механизму «эарн-аута», если стартап достигнет целевых метрик выручки к 2029 году.
P.S. Поддержать меня можно подпиской на телеграмм-канал «сбежавшая нейросеть», где я пишу про ИИ с творческой точки зрения.
Политолог Ян Бреммер: «Учиться программировать сегодня — худшее, что можно посоветовать»
В выпуске ток-шоу Real Time with Bill Maher от 19 июня 2025 года известный политолог и основатель Eurasia Group Ян Бреммер резко раскритиковал популярный еще недавно совет молодежи учиться программировать.
«Пять лет назад это был, наверное, самый разумный совет, который вы могли дать своему ребенку. А теперь это буквально худший совет. Хуже, чем татуировка на лице» — Ян Бреммер
Бреммер считает — технологии развиваются настолько быстро, что навыки кодирования теряют ценность уже на этапе их освоения. Он также отметил, что генеративные ИИ-системы уже способны выполнять задачи, которые раньше требовали многолетнего обучения. Это, по его мнению, радикально меняет правила игры на рынке труда и делает многие профессии, включая программистов, уязвимыми к автоматизации.
Бреммер подчеркнул, что текущие изменения затрагивают не только технологические профессии, но и всю структуру занятости в экономике. А на вопрос ведущего, что в таком случае стоит изучать, эксперт дал уклончивый ответ: «Вот в чем проблема — мы не знаем».
P.S. Поддержать меня можно подпиской на ТГ-канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой точки зрения.


