LLM и проблема Эрдеша1
Новое интересное утверждение о том, что LLM решили открытую проблему в математике, заслуживает внимания и подробного разбора. Я попытался разобраться и попытаюсь вкратце рассказать.
Для контекста надо объяснить вначале, что такое "список Эрдеша".
Пал Эрдёш был знаменитым венгерским математиком, невероятно продуктивным, автором более 1400 статей, почти все из них написаны в соавторстве (более 500 различных соавторов из десятков стран). Он коллекционировал и публиковал интересные нерешенные вопросы, чаще всего в теории чисел, комбинаторике, теории графов и теории вероятностей. Сайт "проблемы Эрдеша" собрал список из более 1100 таких нерешенных проблем и отслеживает публикации о них и их статус после его смерти в 1996 (около 40% решены до сих пор).
Не так давно промелькнула новость о том, что ChatGPT нашел решение одной из открытых проблем Эрдеша, и это восторженно обсуждали в соц. сетях полдня или день, пока не обнаружилось, что путем испорченного телефона пропал важный нюанс: он "нашел решение" в том смысле, что "нашел уже существующую старую статью, еще из 1960-х, в которой дается решение, и о которой не знал ни Эрдеш, ни автор сайта проблем". Это несомненно примечательно, и показывает мощь LLM в обработке огромного количества материала, на котором они были натренированы, но все-таки далеко не то же самое, что "сам нашел неизвестное ранее решение". Дошло до того, что один из вице-президентов OpenAI удалил твит, в котором хвастался этим достижением, а другие важные игроки в этой сфере постили саркастические замечания в этой связи.
Сегодняшняя новость не из таких. С помощью Aristotle, новой LLM, которая находит напрямую формальные доказательства математических утверждений (эти доказательства можно потом верифицировать, и если они проходят проверку, считать вопрос закрытым), решена другая открытая проблема с сайта Эрдеша, проблема номер 124. Там действительно не было известно решение. Но... есть нюанс.
В статье 1996 года Эрдеш с тремя соавторами (один из них - Рональд Грэм, другой знаменитый математик) рассмотрел следующую задачу. Возьмем какой-то набор натуральных чисел, например 3,4,5, и рассмотрим все их степени, расставленные по порядку. Эти степени: 3,9,27,81... 4,16,64... 5,25,125,... если их расставить по порядку, выйдет: 3,4,5,9,16,25,27,64,81,125...
Верно ли, что начиная с какого-то числа N, любое число больше N может быть представлено как сумма степеней из этого списка (каждую степень можно брать не больше 1 раза)?
Например, для этого набора 3,4,5 и этого списка степеней можно видеть, что 1,2,6,10 невозможно составить как сумму чисел из этого списка. Дальше есть еще несколько невозможностей, но самая большая из них - 79. В своей статье они доказали, что любое число больше 79 можно представить, как сумму: скажем, 80=64+16, 81=64+9+5+3 итд.
(в статье ошибочно указано 78 вместо 79, я исправил ошибку. 78=64+9+5, 79 нельзя представить)
Что если я возьму какой-то другой набор вместо 3,4,5, ну скажем 10,95,102? Будет ли и тогда, начиная с какого-то числа, возможно представить любое как сумму степеней? Для того, чтобы был шанс на это, нужно как минимум два требования к набору. Во-первых, чтобы наибольший общий делитель всех чисел был 1: скажем, если это не так, и все числа в наборе кратны 3, скажем 3,6,9, очевидно, что любая сумма степеней тоже кратна 3, и невозможно будет *любое* число начиная с какого-то представить как сумму. Это очевидно. Во-вторых, эти числа должны быть в некотором смысле "достаточно маленькими", иначе их степени имеют слишком много "дырок". А именно, должно выполняться неравенство: сумма 1/(x-1) по всем x из набора больше или равна 1. Скажем, набор 3,4,5 это условие выполняет: 1/2 + 1/3 + 1/4 больше 1. А набор 10,95,102 не выполняет, и поэтому с ним шанса нет. Это условие не так очевидно, но можно доказать, что оно необходимо, стандартными средствами теории чисел.
Так вот, если я возьму набор чисел, который выполняет эти два условия, будет ли ТОГДА гарантировано, что начиная с какого-то числа все можно записать как сумму степеней набора? Это и есть открытая проблема, которую сформулировали
Эрдеш с соавторами в этой статье. Они не смогли ее решить в общем случае - только для некоторых наборов, как например 3,4,5.
А новый LLM "Аристотель" от компании Harmonic смог ее решить, нашел доказательство там, где не справились Эрдеш, Грэм и еще двое математиков? Так? Не совсем так. Есть нюанс.
Когда я сказал "возьмем список всех степеней каждого числа из набора", я начал с ПЕРВОЙ степени: 3,9,27... 4,16,64... Можно понять это по-другому и начать с НУЛЕВОЙ степени, которая всегда равна 1: тогда список степеней будет такой: 1,1,1,3,4,5,9,16,25,27,64,81,125... Три единицы в начале, потому что отдельно можем брать нулевую степень от 3, 4 и 5. Зададим тот же вопрос: можно ли любое число, начиная с какого-то, записать как сумму степеней из этого списка, если набор выполняет два условия выше.
Именно в таком виде, "с единицами", статья сформулирована на сайте "проблемы Эрдеша". Как это вышло? Ну дело в том, что статья 1996 года не была единственным источником этой задачи; в следующем году Эрдеш опубликовал небольшую обзорную статью "Problems in Number Theory" в журнале новозеландской математики (публиковать во всяких рандомных журналах было для него нормальным делом), где свел вместе несколько нерешенных проблем, включая эту. В этой статье он не указал условие "наибольший общий делитель равен 1", а насчет того, какая степень первая, 0 или 1, написано немного неясно. Видимо, составитель сайта именно из этой статьи взял точную формулировку проблемы: у него тоже нет требования про наибольший общий делитель, а степень указана с нуля, т.е. список степеней "с единицами".
Так вот, оказывается, что у задачи "с единицами" есть очень простое элементарное доказательство, причем гораздо более сильного факта: что ЛЮБОЕ число (а не "начиная с какого-то") можно представить как сумму из списка степеней. И именно это доказательство нашел Аристотель. Единицы оказываются очень сильным подспорьем. И условие по наибольшему общему делителю тоже оказывается ненужным - нужно только по сумме 1/(1-x).
Что же в итоге доказано? Скажем так, есть исходная статья 1996 года, где соавторы сформулировали Г1 (Гипотезу-1). Есть статья Эрдеша 1997 года, где он дает немного другую формулировку, которую можно прочитать как Г2 (Гипотеза-2), хотя он говорит, что всего лишь повторяет задачу из статьи 1996 года. Именно в виде Г2 задача лежит много лет в списке нерешенных задач Эрдеша, со ссылкой на все три статьи, пока не приходит человек и с помощью LLM не находит очень простое решение.
Мне кажется, что в статье 1997 года Эрдеш просто небрежно сформулировал, но все-таки имел в виду Г1. А задача Г2, хоть и висела на сайте много лет, либо не получала почти внимания математиков, либо те шли читать исходную статью-1996 и пытались решать тяжелую задачу Г1. Если бы математик-специалист задумался именно над Г2, как над свежим отдельным утверждением, без контекста тяжелой задачи Г1 и сложных методов, которые к ней применялись, то скорее всего быстро бы решил ее.
В свете этого то, что найдено простое решение Г2, приятно и красиво, но гигантским шагом вперед я бы не назвал. Вот так примерно. Буду рад поправкам и предложениям от экспертов.
P.S. Вот суть простого доказательства Г2, которое нашел LLM. Сказать, что любое число можно представить в виде суммы из данного списка степеней, эквивалентно тому, что сумма первых N степеней из этого списка, для любого N, больше или равна следующей степени минус 1. Например, напомню список степеней "с единицами" для набора 3,4,5:
1,1,1,3,4,5,9,16,25,27...
Мы видим, чтo первое число не меньше второго минус 1. Сумма первого и второго не меньше третьего минус 1. И так далее, скажем 1+1+1+3+4+5+9 >= 16-1. Если мы это докажем для любого n, из этого легко следует, что любое число можно представить как сумму (подробности опускаю, но могу объяснить, если надо).
Но сумму скажем первых десяти членов можно разбить на геометрические прогрессии: 1+3+9+27, 1+4+16, 1+5+25. Сумма каждой прогрессии равна (d^n-1)/(d-1), это из школьной программы: в данном случае это (81-1)/(3-1), (64-1)/(4-3), (125-1)/(5-1). Если мы в этой сумме все числители заменим на наименьший из них, тут это 64-1, то получим что-то меньше. Вынеся это за скобки, получим сумму по всем числам набора 1/(x-1), которая по условию больше или равна 1, так что заменив всю сумму на 1, опять уменьшим.
Короче, число 64-1 меньше, чем вся эта сумма первых десяти членов. Но следующее число в списке как раз наименьшее из еще отсутствующих в нем степеней - как раз 64 в этом примере. Поэтому сумма первых десяти больше или равна одиннадцатому минус 1, 64-1. И так для любой суммы первых n членов.
Ссылки по теме: страница на сайте проблем Эрдеша, статья 1996 года, статья 1997 года.
Теорема Эйлера-Савари в трактовке советских «файдоров» …
Сие: вариант этюда для «Пикабу»…
Спросим всепроникновенную "Алису" за теорему Эйлера-Савари!
Рис.1
"... радиусами кривизны профилей"?! Вероятно, «первоисточником» такой трактовки теоремы Эйлера-Савари явились труды знаменитого советского механика тов. Н.И.Колчина. Например, фундаментальный труд «Механика машин». Рисунок из т.1 «Механики машин» 1972-го года издания:
Рис.2
Нетрудно понять, что на приведённом рисунке - построение Бобилье для точек С1 и С2: точка С2 - центр кривизны траектории, которую описывает точка С1 при обкаточном движении тела 1 вокруг неподвижного тела2. Разумеется, точка С1 «автоматически» будет центром кривизны траектории точки С2 в случае неподвижного тела 1 и «обкатывающего» тела 2.
Вопиющую ошибочность колчинской трактовки теоремы Эйлера-Савари(Ф.!) нетрудно понять из рис.3, на котором построены циклоиды, описываемые точками на сопряжённом профиле (например, эвольвентном) подвижного зубчатого колеса 1 при обкатке его относительно (условно) неподвижного колеса 2:
Рис.3
Замечание: очевидно, что профиль второго колеса есть огибающая семейства циклоид от точек на профиле колеса 1.
Непонимание сути (красивейшей !) теоремы Эйлера-Савари, вероятно, приводит тов. Н.И.Колчина к такому ошибочному суждению:
Рис.4
Во-первых, «на одном из колёс профиль зубьев» - совершенно не произвольный. Согласно теореме Виллиса (о мгновенном передаточном отношении - главная теорема зацепления), профиль «на одном из колёс» должен быть таким, чтобы нормаль к этому профилю в каждом угловом положении колеса на всём интервале касания с сопряжённым профилем проходила через полюс зацепления (мгновенный - в общем случае). Фактически же (см. «Замечание» выше), профиль «на одном из колёс» порождает профиль на другом колесе.
Во-вторых, как показано на рис.3, теорема Эйлера-Савари - суть элегантный способ нахождения центра кривизны траектории (циклоиды) данной конкретной точки на обкатывающем колесе. Разумеется, этот центр кривизны может быть вычислен методами аналитической геометрии. В общем случае - при переменном передаточном отношении - теорема Эйлера-Савари даёт ограничение на локальную кривизну сопряжённых профилей.
Исходя из вышесказанного, можно сделать такой вывод: геометрия сопряжённых профилей полностью следует из теоремы Виллиса. Теорема Эйлера-Савари при построении сопряжённых профилей может играть только сугубо вспомогательную роль.
………………………….
(Отметим, для примера, ещё одну очевидную ошибку тов. Н.И.Колчина:
Рис.5
Почему линия зацепления цевочной передачи с цевкой ненулевого радиуса не будет дугой окружности r1:
Рис.6)
Так что…
(Ещё про «пёрлы» советских «файдоров» - на Дзен-канале «Добро» на вентилятор»... Там же ж: иллюстрации к сему писанию.)
Математика миф, в который мы верим
Сегодня я приведу собственные доказательства, как разрешающие отдельные заблуждения в математических правилах, которые все изучают в школах, вузах, так и открывающие фундаментальные ошибки всей математики, и даже самой математики. Понять это самим математикам будет просто, людям-логики также, творческим личностям скорее тоже, а вот верующим в математику, верующим в стереотипы общепринятого, это понять будет невозможно. Поэтому забываем всё, во что верим среди материального, или, кто сразу так не может, читаем мои предыдущие статьи.
4. На ноль делить нельзя. А слова написаны. Итак, ноль является символом ничто. Возьмём любую вещь, например пенал. Разделим пенал ничем. Что получаем? Целый пенал. Ничего сверхнерешимого, катастрофного здесь не происходит. Отсюда, любое число можно делить на ноль, в ответе будет получаться тоже самое число. 50/0=50, 40/0=40 и тп.. Но зачем это делать? Вот и запретили. Однако тут и начинается самое интересное. Почему не запрещено умножение на ноль? А вся математика?
2. 2*0=0. Бубен ощущает дождь. Как наука, математика обязана быть привязана к материальным доказательствам. Приведу их. Любые действия с ничем, никак не вредят предметам. Так, умножение на пустые части является не превращающим в пустоту, а оставляющим исходное состояние предмета. Например, если школу попробовать увеличить чистым вакуумом, пустотой, она останется в своём прежнем состоянии. Школа состоит из кирпичей, досок, а пустота - из ничего, а ничего не оказывает воздействия на что-то, - на материю. Отсюда, 2*0=2, 88*0=88 и тп..
1. Математика - точная наука. Мистика растёт в самооценке. А потому что точка - вещь размытая. Если её увеличить, мы заметим её ужасающую неточность. И так можно бесконечно продолжать поиски истинной точности пространства. А математика выдумывает себе точку, исходит из фантазии. Априори же, совершенно любая цифра в математике раскладывается на неопределённое, бесчисленное количество более мелких составляющих.
5. Действия с бесконечностями. Тушёнка в мешке пятый год. Да такое есть, в высшей математике.. вроде в ней.. открытым текстом, в отличии от школьной математики. Складывая бесконечность с бесконечностью там получают результат. Но проблема в том, что бесконечность в данных действиях не является таковой. Настоящая бесконечность одна, или, в крайнем случае, при сложении двух бесконечностей, можно получить только такую же бесконечность, - бесконечность 2+2..
3. 2+2=4. Колдование огурцом превосходно. Вот она, выдуманная основа математической логики. Каждая цифра не точна, а раскладывается на бесконечное множество чисел. Вообще, считая 2+2, мы можем получать результат 4, но он является фантазией производных таких-же фантазий (2+2). В математике мы складываем, делим, умножаем, вычитаем бесконечности.
0. Думаю, уже ясно, что на цифры перед пунктами в этой публикации не стоит обращать внимания, как, от части, на второе забавное утверждение в каждом пункте. Но ведь именно они путали привычное мышление, которое позволяет нам быстрее и лучше ориентироваться в этом мире. Наша логика крайне важна для существования в нашей реальности. А математика, в свою очередь, важна для развития человека как определённая сверх-игра. Но верить и заучивать как единственно верные, точные правила, математику не стоит. Материально, математика обосновывается лишь единым целым бесконечностей, а любые её разложения созданы нашим мышлением для нашего же развития как упражнения, так и средства ориентации в этом мире.
В жизни, любые естественные науки, более-менее подкреплённые материальным началом, будут точнее и математичнее самой математики. Которая является основой их понимания...
Снижена оценка за порядок множителей - справедливо?
Дочь, в 3 классе, писала самостоятельную работу.
Задача:
1 действие: 7 кают умножаем на 3 места, получаем всего 21 место.
Учитель снижает оценку, т.к. надо было умножать 3 места на 7 кают, получаем те же 21 места.
В чем смысл такого исправления?
Примерчик, посвящённый уходящему году
Расставьте скобки и знаки арифметических действий так, чтобы получилось верное равенство:
4 5 9 8 7 10 = 2025.













