Ученые предложили новый метод оценки хаоса с помощью машинного обучения
Автор исследования — Максим Беляев
© Андрей Величко
Ученые создали новый способ анализа хаотических систем, таких как атмосферные процессы (погода) или экономика. В рамках предложенного метода алгоритм машинного обучения оценивает хаотичность — показатель того, насколько изменения в системе предсказуемы — всего по 450 точкам данных вместо тысяч, как в классических подходах. Кроме того, точность измерений с помощью такого подхода превышает 99% на эталонных моделях. Метод сохраняет точность даже при наличии шумов в сигнале — искажений, которые портят качество данных, — которые часто встречаются в реальных экспериментах. Этот подход открывает возможности для прогнозирования изменений разных процессов в энергетике, метеорологии и медицине, где важны быстрые и точные расчеты. Результаты исследования, поддержанного грантом Российского научного фонда (РНФ), опубликованы в журнале Chaos.
Хаотические системы известны благодаря «эффекту бабочки»: когда незначительное событие в начальный момент времени приводит к серьезным изменениям в будущем. К таким системам относятся турбулентности в газах и жидкостях, изменения погодных условий, рост и падение экономики, активность нейронов в мозге и другие явления, которые сложно предсказать. Несмотря на название, такие системы все же подчиняются фундаментальным законам и характеризуются математической моделью, при которой система быстро «забывает» свое начальное состояние, из-за чего возрастает ошибка предсказания ее будущего поведения. Скорость этого разбегания определяется с помощью старшего показателя Ляпунова — математического параметра, который отображает, насколько быстро малые ошибки в начальных условиях приводят к полной потере предсказуемости. Традиционные методы расчета старшего показателя Ляпунова часто требуют больших объемов данных и сложных вычислений, а при некачественных исходных данных их точность резко падает.
Ученые из Петрозаводского государственного университета (Петрозаводск) предложили новый подход, который обходит ограничения классических методов расчета показателя Ляпунова. В его основе лежит стандартный алгоритм машинного обучения, который сначала изучает прошлое системы и начинает строить догадки о ее будущих состояниях, а затем проверяет, насколько сильно ошибается в своих прогнозах. Чем быстрее растет эта ошибка, тем более хаотичной считается система. Алгоритм анализирует поведение системы и измеряет скорость ее изменения (старший показатель Ляпунова). В отличие от классических способов, ученые поручают машинному обучению предсказать поведение системы для точного расчета показателя Ляпунова.
Авторы протестировали предложенный метод на четырех классических моделях хаоса — формулах, которые генерируют сложное хаотическое поведение и с помощью которых ученые проверяют универсальность своих методов. Точность определения значений старшего показателя Ляпунова, которые измерялись в эксперименте, оказалась выше 99%, что указывает на практически полное совпадение с эталонными значениями.
Еще одно важное преимущество метода — его эффективность на небольших наборах данных. Для получения точного прогноза классическими методами необходимо минимум 1000–5000 точек данных, а новому методу для этой цели достаточно всего 450 точек, при этом в некоторых случаях приемлемые результаты достигались и вовсе на 50 точках.
Поскольку реальные данные всегда содержат шумы — некачественные сигналы, — ученые проверили устойчивость метода, добавив в модель белый шум. Это значит, что в исходных данных сигнал искажают шумом, из-за чего алгоритму сложнее моделировать поведение системы. Оказалось, что точность оценки остается высокой при отношении сигнала к шуму выше 30 децибел (как небольшой фон в аудиозаписи) и резко падает только ниже 27 децибел (сильный шум как на улице в час пик). Такая устойчивость к шуму дает возможность применять метод в экспериментальных условиях на реальных системах.
Разработанный метод может стать мощным инструментом для анализа данных в самых разных областях, например, в энергетике для оценки устойчивости систем к каскадным авариям, в метеорологии для уточнения пределов предсказуемости погоды и климатических изменений, а также в медицине для диагностики нарушений по данным ЭЭГ и кардиосигналов.
«С помощью нашего подхода можно быстро проанализировать экспериментальные данные и определить, насколько система хаотична. Использование машинного обучения дает возможность эффективно работать даже с данными низкого качества. В будущем мы планируем довести метод до уровня инженерного инструмента: расширить его на более сложные сигналы и реальные измерения, добавить адаптивные и шумо-осведомленные модули и поэтапно обновлять открытый GitHub-репозиторий с примерами и бенчмарками», — рассказывает руководитель проекта, поддержанного грантом РНФ, Андрей Величко, кандидат физико-математических наук, доцент кафедры информационно-измерительных систем, электроники и автоматики Петрозаводского государственного университета, заведующий учебно-научной лабораторией по разработке электронной компонентной базы на основе микро- и наноструктур Петрозаводского государственного университета.