Более четкий вид Млечного Пути с Gaia и машинным обучением

10 октября 2024, 15:53 / Наука → Новости / Наука

Крупномасштабная карта (длина стороны 330 000 световых лет) плотности 217 миллионов звезд из выборки Gaia DR3 XP в галактоцентрических декартовых координатах. Автор: F. Anders, Universitat de Barcelona

Группа ученых под руководством Института астрофизики имени Лейбница в Потсдаме (AIP) и Института космических наук Барселонского университета (ICCUB) применила новую модель машинного обучения для чрезвычайно эффективной обработки данных по 217 миллионам звезд, наблюдавшихся в ходе миссии Gaia.

Результаты конкурентоспособны с традиционными методами, используемыми для оценки звездных параметров. Этот новый подход открывает захватывающие возможности для картирования таких характеристик, как межзвездное поглощение и металличность по всему Млечному Пути, помогая в понимании звездных популяций и структуры нашей галактики.

Благодаря третьему выпуску данных космической миссии Gaia Европейского космического агентства астрономы получили доступ к улучшенным измерениям 1,8 миллиарда звезд, что обеспечивает огромный объем данных для исследования Млечного Пути.

Однако эффективный анализ такого большого набора данных представляет собой проблему. В исследовании ученые изучали использование машинного обучения для оценки ключевых свойств звезд с использованием спектрофотометрических данных Gaia. Модель была обучена на высококачественных данных от 8 миллионов звезд и достигла надежных прогнозов с небольшими неопределенностями.

Работа опубликованав журнале Astronomy & Astrophysics.

«Базовая технология, называемая деревьями с экстремальным градиентным усилением, позволяет с беспрецедентной эффективностью оценивать точные свойства звезд, такие как температура, химический состав и затенение межзвездной пылью. Разработанная модель машинного обучения SHBoost выполняет свои задачи, включая обучение модели и прогнозирование, в течение четырех часов на одном графическом процессоре — процесс, который ранее требовал двух недель и 3000 высокопроизводительных процессоров», — говорит Арман Халатян из AIP и первый автор исследования.

«Таким образом, метод машинного обучения значительно сокращает время вычислений, потребление энергии и выбросы _CO2». Это первый случай успешного применения такого метода к звездам всех типов одновременно.

Модель обучается на высококачественных спектроскопических данных из небольших звездных обзоров, а затем применяет эти знания к третьему большому выпуску данных Gaia (DR3), извлекая ключевые звездные параметры, используя только фотометрические и астрометрические данные, а также спектры Gaia XP низкого разрешения.

«Высокое качество результатов снижает необходимость в дополнительных ресурсоемких спектроскопических наблюдениях при поиске хороших кандидатов для дальнейших исследований, таких как звезды с низким или высоким содержанием редких металлов, имеющие решающее значение для понимания самых ранних фаз формирования Млечного Пути», — говорит Кристина Кьяппини из AIP.

Этот метод оказывается решающим для подготовки будущих наблюдений с использованием многообъектной спектроскопии, таких как 4MIDABLE-LR — крупномасштабное исследование Галактического диска и балджа, которое станет частью проекта 4MOST в Европейской южной обсерватории (ESO) в Чили.

«Новый модельный подход предоставляет обширные карты общего химического состава Млечного Пути, подтверждающие распределение молодых и старых звезд. Данные показывают концентрацию богатых металлами звезд во внутренних областях галактики, включая перемычку и балдж, с огромной статистической мощностью», — добавляет Фридрих Андерс из ICCUB.

Команда также использовала модель для картирования молодых, массивных горячих звезд по всей галактике, выделяя далекие, плохо изученные регионы, в которых формируются звезды. Данные также показывают, что в нашем Млечном Пути существует ряд «звездных пустот», то есть областей, в которых находится очень мало молодых звезд. Кроме того, данные показывают, где трехмерное распределение межзвездной пыли все еще плохо решено.

Поскольку Gaia продолжает собирать данные, способность моделей машинного обучения быстро и устойчиво обрабатывать огромные наборы данных делает их важнейшим инструментом для будущих астрономических исследований.

Успех подхода демонстрирует потенциал машинного обучения для революционного преобразования анализа больших данных в астрономии и других научных областях, одновременно способствуя более устойчивым методам исследований.

Больше информации: A. Khalatyan et al, Transferring spectroscopic stellar labels to 217 million Gaia DR3 XP stars with SHBoost, Astronomy & Astrophysics (2024). DOI: 10.1051/0004-6361/202451427. On arXiv: DOI: 10.48550/arxiv.2407.06963

Источник: Leibniz Institute for Astrophysics Potsdam