Математический язык и открытия: от Архимеда до квантовой гравитации
/imgs/2025/10/07/02/6905532/6832be175d3ca1d54b2ab34f52f10b9f31706652.jpg)
© Личный архив Андрея Окунькова
Андрей Окуньков — российский и американский математик, лауреат Филдсовской премии. Он работает в Колумбийском университете (Нью-Йорк), но остаётся тесно связан с российской академической средой – в 2014-ом году стал одним из научных руководителей международной лаборатории теории представлений и математической физики факультета математики ВШЭ.)
Основные работы посвящены теории представлений и её приложениям к алгебраической геометрии, математической физике, теории вероятностей и теории специальных функций. Член Национальной академии наук США и Американской академии искусств и наук.
В рамках доклада «Математика и язык» на Practical ML Conf 2025 Андрей рассказал, что такое математический язык, что считать математическим открытием, какую роль играет интуиция, и какие задачи стоят перед математической физикой и машинным обучением. Приводим пересказ этого выступления.
Вступление
В контексте доклада была заявлена тема о языках. Это актуальная тема в контексте больших языковых моделей. Математический язык интернационален и универсален — им пользуются не только математики, но и физики, химики, экономисты. Этот язык безальтернативен: если вы хотите изъясняться с той степенью точности, которой требуют современные технологии, вам придется изъясняться на языке математики — другого варианта нет. Это особенно важно сейчас, когда большие языковые модели уже прочитали все математические знания, выложенные в открытый доступ.
Раз этот язык так важен, надо его понимать и правильно пользоваться. Конкретные вопросы, которые мы сегодня зададим: как развивается или меняется математический язык? Что такое математическое открытие? Как изменения в языке либо знаменуют появление математического открытия, либо, наоборот, маскируют его? Мы поговорим о роли невербального — чутья — в развитии математики. И наконец, обсудим некоторые большие задачи, которые стоят перед машинным обучением в математической физике.
Два направления развития математики
Часто за процесс развития математики принимается либо «Начала» Евклида, либо старый школьный учебник: то есть задается набор аксиом и логических правил, из которых потом выводятся следствия. Можно создать впечатление, что мы просто перебираем все возможные логические ходы. Поэтому многие думают: возьмем большую языковую модель, перенаправим ее вывод на программы проверки доказательств — и к нам польется чистая математическая мудрость.
Такое развитие «вниз по течению логической мысли» происходит постоянно и, разумеется, важно. Но, с моей точки зрения и точки зрения большинства моих коллег, самое главное в математике — это идти в другую сторону, против течения логической мысли.
Математики постоянно задают себе вечные вопросы: зрим ли мы в корень? Задаем ли мы самый важный вопрос? Рассматриваем ли действительно самые важные объекты? Когда приходишь к осознанию, что есть что-то более фундаментальное, а то, что мы рассматривали раньше, оказывается только гранью, частным случаем, приближением.
Математическое открытие — это та новая точка зрения, встав на которую становится ясен путь к решению как первоначальной задачи, так и многих других. Эта новизна может быть новым математическим объектом или новым свойством известных объектов. Когда открыли что-то новое, встает вопрос: каким словом его обозначить? Иногда вводят новое слово, но чаще начинают использовать старые слова в новом или расширенном смысле. В первом случае появление слова знаменует открытие, во втором — маскирует его. Чтобы проиллюстрировать это, можно обратиться к математической физике.
Великая книга природы и эволюция понятия силы
Еще в XVII веке Галилей писал о воображаемой великой книге природы, написанной языком математики. Важно понять: каждая следующая глава этой книги требует новой математики. Отношение новой математики к старой — не логическое следствие, а корень, новая точка зрения, по сравнению с которой предыдущее знание — частный случай.
Как пример, рассмотрим слово, которое постоянно используется в новом значении — «сила». Вместе с понятием силы всегда существовал принцип: сила действует в сторону уменьшения некоторой целевой функции. Название этой функции меняется в зависимости от главы книги природы. Всем, кто применяет градиентный спуск, это близко знакомо.
От Архимеда к Ньютону
Возьмем еще более конкретный пример. Помните песню Окуджавы: «Девочка плачет — шарик улетел»? Почему улетел шарик? Обычный ответ: под действием архимедовой силы, поскольку гелий легче воздуха.
Архимед в III веке до н.э. посвятил выталкивающей силе две книги «О плавающих телах». Для него сила действует при отклонении от естественного положения жидкости. Естественное положение — шар с центром в центре Земли. Если вы хотите построить лодку, знаний Архимеда достаточно. Но если спросить, как быстро будет улетать шарик, Архимед не ответит — у него нет понятия времени, у него статика.
Язык для таких вопросов пришлось ждать от Ньютона, который ввел дифференциальное уравнение как главный язык математической физики. Ньютонов закон F = ma — это дифференциальное уравнение, где вторая производная координаты по времени равна силе. То, что было раньше — статика Архимеда, — просто частный случай.
Для всех фундаментальных потенциальных сил это уравнение означает: сила есть градиент энергии. Мы буквально минимизируем энергию.
Статистическая физика: от энергии к вероятности
Но учение Ньютона не всесильно. Простой вопрос: почему шарик летит вверх, когда сила притяжения направлена вниз? Я задал этот вопрос DeepSeek, и он дал вполне разумный ответ. Точка зрения, что большие языковые модели сейчас на уровне аспиранта в математике, вполне адекватна.
Чтобы обозначить масштаб проблемы: для понимания движения шарика надо говорить о движении молекул. Их немыслимое множество, они несутся со скоростью около 500 метров в секунду и пролетают всего 60 нанометров до столкновения. Общий вывод: то, что толкает шарик, — это не энергия, а вероятность.
Архимедова сила возникала при отклонении от естественной формы. У Ньютона принцип возникал как минимум потенциальной энергии. А в статистической физике вещества состоят из немыслимого числа хаотически взаимодействующих молекул, и результат, который мы видим, максимизирует вероятность случиться.
Есть вероятностное распределение с очень острым пиком. Положение пика описывается ньютоновской механикой. Когда пик безумно острый, ньютоновская механика очень точна и полезна для большинства приложений. Но это только приближение. Настоящее движение шарика — очень случайный процесс с острым пиком, который мы описываем как траекторию.
Квантовая физика и общая теория относительности
Если заглянуть внутрь молекул, нас ждет квантовая физика. Ее язык еще более экзотичен: немыслимое число случайных событий с вероятностями, выраженными комплексными числами. Градиент становится скоростью осцилляций. Где градиент не нулевой, осцилляции друг друга сокращают, остается только кусок, где градиент зануляется.
С другой стороны, притяжение молекул Землей выглядит как безумная задача: у Земли в «голове» должна быть картинка каждой молекулы с координатами. Эйнштейн догадался, что это не нужно. Все, что Земля делает, — она искривляет пространство вокруг себя, а кривизна заставляет тела отклоняться от прямолинейного движения. Каждое тело движется само по себе, взаимодействуя через совместное пространство. По сути, массово-параллельная архитектура.
Квантовая гравитация — великая задача
Мы перешли к рубежу современной науки. Теперь есть одна вершина математической физики — квантовая физика, другая — теория Эйнштейна. Но мир один, поэтому должна быть теория, где частными случаями являются обе. Такой теории наука не знает. Это огромная открытая задача, к которой многие обращаются, применяя искусственный интеллект и машинное обучение. Что нужно для прорыва? Больше всего — совершить множество попыток, попробовать разные подходы, чтобы найти тот, который ведет к корню вещей. В методе проб и ошибок машина готова лучше человека, и мы ожидаем ее помощи.
Можно сказать, что искусственный интеллект сейчас на уровне аспиранта. Но, как для аспиранта, ему нужна задача попроще для тренировки.
Невербальный поиск как тренировочная задача
Есть ли такая задача? Да: вместо того чтобы открывать неизвестное, давайте научимся открывать известное, написанное на другом языке.
Представьте: на специализированном языке уже есть ответ, но в других терминах. Вы — прикладной человек или теоретик, ищете по ключевым словам, ничего не находите. Но возможно, существует математика, применимая к вашей задаче, только описанная иначе.
Как найти не словами? Нужен невербальный поиск — не по словам, а по математическим структурам. Слова могут быть совсем другие, а смысл тот же.
Математики, решая такие вопросы, думают не только о ключевых словах, но о схожести структур, логической архитектуре, базовых примерах, характерных функциях. Еще в 1964 году математик Нил Слоан создал систему поиска по последовательностям чисел — вы забиваете последовательность, она показывает, где такая встречалась. Интерфейс тривиален, а ответы очень полезны.
Заключение: проверка на известном
Любой искусственный интеллект, претендующий на создание нового научного знания, должен как-то хранить это знание — не только вербально, но и невербально.
Прежде чем искать новое, предлагается проверить: как невербальные механизмы ИИ распознают применимость существующей теории к задаче? Это поиск не по словам, а по последовательностям чисел, структурам, формулам. Если задействовать невербальную часть для поиска аналогий между известными теориями и новыми задачами, это будет иметь огромное практическое и теоретическое значение.
По сути, это тренировочная задача перед главной целью — открытием нового. Но решение даже этой задачи было бы прорывом, потому что помогло бы находить скрытые связи в уже существующем математическом знании.