Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр  Что обсуждали люди в 2024 году? Самое время вспомнить — через виммельбух Пикабу «Спрятано в 2024»! Печенька облегчит поиск предметов.

Спрятано в 2024

Поиск предметов, Казуальные

Играть

Топ прошлой недели

  • solenakrivetka solenakrivetka 7 постов
  • Animalrescueed Animalrescueed 53 поста
  • ia.panorama ia.panorama 12 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
0 просмотренных постов скрыто
8
NeuralNet.2025
NeuralNet.2025
Лига Новых Технологий

Цифровые бактерии учатся узнавать цифры на фото⁠⁠

1 день назад

Сегодня будем обучать нейросеть. Но не ту, что с миллионами слоев и градиентным спуском, который вечно норовит увести нас в локальный минимум. Нет. Мы будем использовать Морфогенетический Нейро-Рой.

Звучит как название плохого фантастического фильма? Возможно. Но суть в том, что мы имитируем биологию, чтобы решить задачу, которую обычно решают чистой математикой.

Пассмотрим цифровую чашку Петри. В ней живут сотни крошечных, голодных, но очень целеустремленных BioAgent’ов. Их цель? Выжить. А еда? Рукописные цифры из классического датасета MNIST.

Да, мы заставим этих цифровых бактерий эволюционировать, чтобы они научились отличать «семерку» от «единицы». И это — без единого намёка на градиентный спуск!


Анатомия Цифровой Бактерии: Геном и Совесть

Наш главный герой — BioAgent. Это не просто нейрон. Это, по сути, одноклеточный организм, у которого есть:

  1. Геном (W): Вектор весов размером 784. Это его «мысленный образ» того, как должна выглядеть идеальная цифра. В начале они слепы, веса инициализированы около нуля (типичный «Темный старт»).

  2. Энергия (E): Валюта жизни. Угадал цифру — поел. Не угадал — плати за метаболизм. Классика капитализма, только в мире пикселей.

  3. Привыкание (H): Вот тут начинается самое интересное. Это наша «цифровая совесть». Если агент слишком часто побеждает и жрёт, он «устаёт». Его чувствительность падает. Он становится ленивым и должен уступить дорогу молодым и голодным.

Ирония: Мы ввели в модель нечто, что заставляет самых успешных агентов замедляться. Потому что в реальной жизни, если ты слишком долго сидишь на одном месте, тебя съедает конкурент.


Подготовка Среды: Включаем Свет в Многомерном Пространстве

Прежде чем выпустить рой на охоту, нужно подготовить поле боя. Если просто скормить агентам сырые пиксели MNIST, они будут барахтаться в шуме.

Мы делаем трюк с предобработкой: центрирование данных.

X{input} = \frac{X{raw}}{||X{raw}||} - X{mean}

Что это значит на пальцах? Мы вычитаем из каждого изображения «среднюю картинку» всего датасета.

Представьте, что вы смотрите на кучу фотографий. Мы убираем из каждой из них общий фон и среднюю яркость. В результате, то, что было нулем (фоном), становится отрицательным (синим на визуализации), а сама цифра — положительной (красной).

Эффект? Векторы разных цифр становятся ортогональными. Они смотрят в совершенно разные стороны в 784-мерном пространстве. Для наших агентов это как если бы кто-то включил свет в тёмной пещере. Цифры стали выпуклыми и легко различимыми.

Цикл Жизни: 4 Фазы Эволюции (Без Учителя!)

Когда в среду попадает новая цифра X, запускается четырёхфазный цикл, который заменяет нам весь наш любимый градиентный спуск.

Фаза I: Восприятие и Штраф за Жадность

Каждый агент смотрит на X и считает свой Score. Но это не просто сходство. Мы вводим штраф за «привыкание» (H):

Score = (W X) - (beta H)

Если ты недавно много ел (высокий H), твой Score искусственно занижается. И ты не можешь просто так забрать всю еду. Конкуренция с совестью. (Или форма закона сохранения энергии, когда даже самое большое чудище, сидящее на ресурсе, не может одинаково легко и быстро расти бесконечно)

Фаза II: Питание и Эволюция (Правило Хебба в действии)

Победитель (максимальный Score) получает жирный кусок энергии (E \leftarrow E + R_{feed}). И тут же учится по правилу Хебба: «Neurons that fire together, wire together».

W{new} = W{old} + \eta (X - W_{old})

Он подтягивает свой геном к увиденному образу. Причем учатся и ближайшие соседи (Top-2, Top-3), но слабее. Так рождаются «банды» агентов, специализирующихся на одной и той же цифре, но с разными стилями написания.

Фаза III: Метаболизм (Естественный Отбор)

За всё надо платить. E \leftarrow E - E_{cost}. Если агент не смог найти свою нишу и не заработал достаточно, он умирает от голода (Апоптоз). Жестоко? Да. Эффективно? Ещё как!

Фаза IV: Динамика Популяции (Митоз)

Если агент накопил слишком много энергии (E > E_{threshold}), он делится. Но это не просто копирование!

  1. Родитель отдает потомку половину энергии и веса с небольшой мутацией.

  2. Ключевой момент: У родителя H высокий (он устал). У потомка H = 0.0 (он свежий, голодный и очень чувствительный).

  3. Пока родитель «отдыхает» и ждет, пока его H спадет, потомок тут же бросается в бой, чтобы уточнить специализацию. Например, если родитель узнавал «восьмерку» с наклоном вправо, потомок может начать специализироваться на «восьмерке» с наклоном влево. Рой сам заполняет все возможные вариации данных!


Взгляд в Бактерии: Что там внутри?

Давайте посмотрим на результат. Перед нами снимок популяции выживших агентов после первой эпохи. (После показа системе 5000 изображений)

Цифровые бактерии учатся узнавать цифры на фото

Помните про центрирование? Посмотрите на цвета в весах агента (например, G8 W65 — Агент 8-го поколения, 65 побед).

  • Красные/Желтые зоны: Возбуждение. Агент ожидает увидеть здесь чернила цифры.

  • Синий фон: Торможение. Агент ожидает увидеть здесь пустоту.

  • Этот агент — не просто набор чисел. Это фильтр, который настроен на конкретный паттерн. Если входящий пиксель совпадает с красным, а фон — с синим, происходит резонанс, и агент получает энергию. А рядом с ветеранами (W65) вы видите «шумных» новичков с W0. Они либо умрут в следующем цикле, либо найдут свою уникальную нишу, которую еще не заняли доминирующие кластеры.


Выводы: Эволюция лучше, чем градиент?

Почему этот Морфогенетический Нейро-Рой смог распознать цифры без всякого учителя?

Секрет в балансе:

  1. Конкуренция за ресурсы (Энергия).

  2. Механизм усталости (H), который не дает одному агенту монополизировать нишу.

  3. Биологическое размножение с обнулением «совести» у потомства, что обеспечивает постоянное исследование новых вариаций.

  4. Мы не учили систему, что такое «цифра 2». Мы просто создали среду, где выживание зависело от способности находить и уточнять уникальные паттерны в данных.

Мораль: Иногда, чтобы создать интеллект, нужно просто дать ему возможность проголодаться и заставить конкурировать за еду.

Если хотите посмотреть, как это всё работает в коде, загляните по ссылке: https://gitverse.ru/Nikas/NeuralNet.2025/commit/5075d6f248b2...

Что дальше?

Поле непаханное того, что можно сделать:

  1. Разобраться как элегантно из кластеризатора сделать классификатор.

  2. Определить точность с которой эта система классифицирует MNIST и скорость сходимости.

  3. Вертикальный рост (в глубину). Можно создать агентов, которые смотрят не только на пиксели, а на агентов нижних слоев, исследуют глубинные архитектуры и пытаются найти такую топологическую конфигурацию, которая будет стабильно выживать.

  4. Петлевые агенты (обратной связи) - которые смотрят на глубокие слои, находясь в нижних слоях.

  5. Вариации на CNN. Ограничивать количество рассматриваемых агентом пикселей (чтобы он видел не всю матрицу, а только какую-то часть) Будет эффективнее по памяти и сможет находить более низкоуровневые фичи, чем готовые цифры.

  6. Когда все предыдущее заработает можно поробовать классифицировать ImageNet

Увидимся в новой симуляции!

Показать полностью 1
[моё] Контент нейросетей Машинное обучение Генетический алгоритм Кластерный анализ Бионика Эволюция Распознавание Видео RUTUBE Длиннопост
0
Prototype3000
Лига программистов

Нужна помощь с lua + гигачат⁠⁠

15 дней назад

Для ЛЛ.

Нужно довести до ума скрипт преобразования голоса в текст.

Суть проблемы.

Есть некий скринридер для android, который работает на AndroLua с использованием api android (возможно неправильно выразился, но примерно так).

Так вот для данного приложения можно создавать разного рода скрипты. В данном случае нужно адаптировать или создать с нуля скрипт, который при запуске будет записывать речь, а при повторном запуске отправлять записанный файл на обработку в гигачат. Собственно, в наличии подобный скрипт есть, но он основан на гугле. Но вот это вот все – ркн, квн и прочее… Короче без костылей не работает, а то и вообще со  дня на  день залочат. Моих знаний в программировании в данном случае хватает на отправку кода дипсику с вводными данными, но что-то ничего не выходит. То ошибка 400, то ошибка токена.

Api ключ судя по всему рабочий, т.к. дипсик собрал скрипт на питоне, который отправляет аудио и присылает текст.

Ну в общем если кто может помочь, скину код рабочего скрипта, может на его основе получится сделать…

P.s. В  сбер поддержку обращался, но по телефону они такие проблемы не решают,  что не удивительно, а по почте мне написали что-то типа: мы тут не программисты, ты  там на сайте посмотри в разделе помощи нуждающимся.

В общем сюда пишу можно  сказать от безысходности.

Показать полностью
[моё] Помощь Программирование Скрипт Сбербанк Распознавание Текст
5
9
Agmioli
Agmioli
Лайфхак

Как узнать название фильма, если в рилсе/шортсе/отрывке нет его названия⁠⁠

1 месяц назад
Как узнать название фильма, если в рилсе/отрывке нет названия.

Как узнать название фильма, если в рилсе/отрывке нет названия.

Когда вы смотрите Ютуб или ряд соц.сетей, вы встречаете коротки отрывки и рилсы из различных фильмов.
Но бывает, что автор рилса/отрывка, на пишет название по разным причинам. Иногда0-спеицалнло, чтобы вы посетили его телеграм-канал и т.д.

Не спешите подаваться на уговоры авторов таких рилсов, и не переходите в их телеграм-канал или рекламируемый сайт.
Есть простой способ узнать название фильма или мультфильма.

Как узнать название фильма, если в рилсе/шортсе отрывке нет названия?
РЕШЕНИЕ:


1. Сделайте скриншот из рилса/шортса/ отрывка фильма.
2. Откройте сервис Яндекс картинки.
3. Вставьте в распознавание сервиса ваш скриншот.

В итогах поиска Яндекс покажет не только похожие скриншоты. Но и название фильма.

Если по первому скриншоты Яндекс Картинки, не распознал фильм, то сделайте еще разных скриншотов, и дайте их распознать сервису Яндекс картинки.

В итогах поиска Яндекс покажет не только похожие скриншоты. Но и название фильма

В итогах поиска Яндекс покажет не только похожие скриншоты. Но и название фильма

Показать полностью 1
[моё] Лайфхак Фильмы Ролики Яндекс Распознавание Отрывок Социальные сети Youtube Shorts YouTube Shortscarystories Поиск по картинкам Поисковые запросы
5
6
gLong
gLong

Нейронные сети. Распознавания...⁠⁠

1 месяц назад

Заливаю фотки в облако, оно их там распознает и раскладывает по альбомам по тематике. Понадобилось тут что-то найти, лезу в альбомы... и рыдаю....

Нейронные сети. Распознавания...

Морская свинка, сруб дерева, один и тот же форт в Финском заливе и батискаф... Небоскреб в 22 этажа... Фотки серверных стоек обнаружились в разделе "мебель"...
Ну, оно хотя бы бесплатное, да...

"А теперь выберите все картинки со светофорами"...

Показать полностью 1
[моё] Нейронные сети Искусственный интеллект Распознавание Облако Mail
2
2
kameded

Распознать мелодию⁠⁠

2 месяца назад

Что за мелодия играет в док.фильме?

Перейти к видео
[моё] Распознавание Мелодия Музыка Помогите найти Видео Короткие видео
0
BOBAH.1
BOBAH.1
Лига тестировщиков
Серия Циляфон

Ответ на пост «QR-коды, пропущенные через нейросеть»⁠⁠1

2 месяца назад

Моё тестирование:

Редми 10А, Андрон11, Миуи 12 - Встроенный сканер

+1,2,5,7,8

-3,4,6

Редми Онже - скачанный Сканер qr и штрих кодов от Gamma Play 2.2.95

+1,2,4,5,6,7,8

-3,

Ответ на пост «QR-коды, пропущенные через нейросеть»

Самсунг Гэлэкси J4, Андро9 - тот же сканер

+1,2,4,5,6,7,8

-3,

Лучший сканер КУАР-кодов однозначно!

Показать полностью
[моё] QR-код Альфонсо куарон Сканирование Распознавание Сканер штрихкодов Мобильное тестирование Ответ на пост
0
33
K.rakokot
K.rakokot

Серый жако и его способности⁠⁠

2 месяца назад
Перейти к видео
Попугай Жако Птицы Разговор Животные Домашние животные Обучение Говорящие животные Речь Распознавание Видео Вертикальное видео Английский язык
7
kameded

Распознать саундтрек⁠⁠

2 месяца назад

Всем привет. Кто-нибудь в курсе, что за мелодия?

Перейти к видео
[моё] Ищу музыку Распознавание Музыка Помогите найти Видео Короткие видео
1
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии