Разработан способ обнаружения аномалий в астрономических данных
Ученые из России, США и Франции разработали программу, которая может выделять редкие и уникальные события среди большого массива астрономических данных. Исследование опубликовано в журнале Monthly Notices of the Royal Astronomical Society.
С каждым годом все больше растут объемы астрономических данных. Из-за этого все труднее среди миллионов и миллиардов наблюдений найти необычные объекты, свойства которых отличались бы от свойств большинства. Решить эту проблему можно с помощью специальных автоматических инструментов, которые могли бы обнаруживать аномалии. Подобные системы применяются в повседневной жизни, например для выявления случаев мошенничества с кредитными картами среди миллионов ежедневных транзакций. Но использование таких инструментов в астрономии требует их адаптации к особенностям науки, например нерегулярности астрономических наблюдений.
Над решением этой задачи и работает проект SNAD. Чтобы создать эффективный инструмент, исследователи объединили алгоритмы машинного обучения и знания экспертов-астрофизиков. Разработанный метод включал в себя следующие этапы: выделение признаков, характеризующих изменение блеска объекта с течением времени, поиск кандидатов в аномалии с использованием нескольких алгоритмов машинного обучения и ручную фильтрацию кандидатов специалистом-человеком, для которой исследователи проводили дополнительные наблюдения с помощью телескопов Кавказской горной обсерватории ГАИШ МГУ.
Группа из четырех алгоритмов машинного обучения проанализировала 2,25 миллиона переменных объектов в каталоге переменных источников Zwicky Transient Facility, из которых было выделено 277 кандидатов в аномалии. 23 объекта из них были обнаружены впервые, 66 оказались известными каталогизированными источниками. Эти две категории представляют потенциальный интерес для дальнейших исследований. Также было обнаружено 188 артефактов первичной обработки изображений. Они мешают анализу кривых блеска источников, заставляя машинные алгоритмы ошибочно думать, что перед ними реальный объект. Однако, по словам ученых, среди обнаруженных объектов не астрофизической природы переменности встретились и довольно курьезные случаи, например резко возросший блеск одного из объектов оказался всего лишь случайным наложением известного астероида Барселона на звезду фона.
Тем не менее в каталоге исследователи обнаружили четыре кандидата в сверхновые, четыре кандидата в молодые звезды до стадии главной последовательности и шесть ранее не классифицированных затменных двойных звезд. Особенно интересны кандидаты в молодые звезды, так как их изучение очень важно для понимания, как формируются звезды. Помимо этого, исследователи обнаружили возможную вспышку красного карлика и яркие голубые переменные, которые в скором времени могут взорваться как сверхновые или гиперновые.
Также авторы разработали специальный веб-интерфейс. Он дает возможность визуализировать и сопоставлять объекты Zwicky Transient Facility с существующими астрономическими каталогами. С помощью этого удастся облегчить работу исследователей, которые заняты изучением кандидатов в аномалии и поиском наиболее интересных объектов для дальнейшего изучения.
Ученые отмечают, что возможность быстро находить потенциально редкие и уникальные объекты на небе очень важна для астрономии. Особенно это актуально из-за скорого появления крупных обзоров, таких как Legacy Survey of Space and Time (LSST), который будет проводится обсерваторией Vera C. Rubin в Чили. LSST будет каждую ночь выдавать около десяти миллионов сообщений о новых событиях, и поэтому необходимы надежные алгоритмы, которые позволят анализировать данные и не упускать интересные явления.
«Разработка специальных инструментов поиска уникальных с астрофизической точки зрения объектов — это единственная возможность максимально эффективно использовать большие объемы астрономических данных. А ведь их получение сопряжено с огромными умственными и финансовыми затратами. Наша команда прикладывает все усилия, чтобы эта возможность стала реальностью», — подчеркнул первый автор исследования, научный сотрудник МГУ имени М.В. Ломоносова Константин Маланчев.