ИИ может ускорить поиск новой физики, но есть неожиданный нюанс
Искусственный интеллект уже играет важную роль в изучении Вселенной космологами. Новое исследование предполагает, что метод машинного обучения под названием «трансферное обучение» может сделать поиск новой физики гораздо быстрее и дешевле. Однако работа выявила неожиданный недостаток: ИИ может настолько сильно полагаться на уже полученные знания, что начинает с трудом распознавать по-настоящему новые явления.
Исследование, опубликованное в Journal of Cosmology and Astroparticle Physics (JCAP), изучало, как трансферное обучение может помочь ученым в исследовании теорий, выходящих за рамки стандартной космологической модели.
Стандартная модель космологии, известная как ΛCDM, успешно объясняет многие крупномасштабные особенности Вселенной, включая ее расширение и распределение галактик. Тем не менее, ученые считают, что эта модель не является окончательным ответом. Недавние наблюдения подняли вопросы, которые могут указывать на новую физику, включая эффекты массивных нейтрино, модифицированную гравитацию и эволюционирующую темную энергию. Изучение этих возможностей требует от исследователей генерации огромного количества детализированных компьютерных симуляций, каждая из которых представляет виртуальную вселенную, построенную на разных физических допущениях. Создание таких симуляций требует огромных вычислительных мощностей и является дорогостоящим.
Ученые исследовали, может ли трансферное обучение сделать этот процесс более эффективным. Трансферное обучение позволяет системе ИИ применять знания, полученные при решении одной задачи, к другой, связанной с ней задаче. Вместо того чтобы обучать нейросеть исключительно на самых сложных и дорогих симуляциях, команда сначала обучила ее на более простых симуляциях, основанных на модели ΛCDM. Этот начальный этап, известный как предварительное обучение, затем следовало дополнительное обучение с использованием более сложных моделей, включающих потенциальную новую физику.
«По сути, это сокращенный путь, — объясняет Эдриан Байер (Adrian Bayer), космолог из Института Флэтайрон и Принстонского университета, соавтор исследования. — Обычно люди обучают ИИ непосредственно на самых вычислительно затратных симуляциях. Мы же сначала используем более простые и дешевые симуляции ΛCDM, чтобы дать ИИ представление о происходящем, и только потом переходим к более сложным моделям».
Байер сравнивает этот подход с изучением материала по учебникам.
«Сначала вы читаете базовую книгу, чтобы получить общее представление о предмете, — говорит Байер, — а затем переходите к действительно сложной книге».
По словам первого автора исследования, Вины Кришнарадж (Veena Krishnaraj), студентки Принстонского университета, эта стратегия не позволяет ИИ «пытаться переварить всё сразу». Результаты оказались впечатляющими. В некоторых случаях трансферное обучение сократило количество необходимых дорогостоящих симуляций более чем в десять раз.
Однако исследование также выявило менее очевидную проблему, известную как отрицательный перенос. Используя аналогию Байера с учебниками, представьте, что вы изучаете медицину по вводному тексту, а затем сталкиваетесь с редким заболеванием, которое очень похоже на распространенное. Существующие знания обычно полезны, но иногда они могут подтолкнуть к неверному выводу. Та же проблема может возникнуть и в системах ИИ.
В некоторых случаях признаки новой физики напоминают шаблоны, которые ИИ уже связал со стандартной космологической моделью. Когда это происходит, предварительно обученная сеть может интерпретировать незнакомую информацию через призму уже известного, что затрудняет распознавание действительно новых эффектов. Исследователи наблюдали этот эффект при изучении симуляций, включающих массивные нейтрино. Некоторые наблюдательные признаки, связанные с массой нейтрино, очень похожи на изменения, связанные с существующим параметром ΛCDM, называемым σ8, который измеряет, насколько сильно материя сгущается во Вселенной. Из-за этого сходства предварительно обученная нейросеть изначально с трудом различала эти два эффекта.
«Отрицательный перенос не случаен. Он обусловлен фундаментальными физическими вырождениями в модели, — говорит Кришнарадж. — Так что это то, о чем нам нужно знать и пытаться смягчить».
Результаты подчеркивают как потенциальные преимущества, так и ограничения применения концепций фундаментальных моделей в физике. Эти подходы во многом схожи по духу с методами, лежащими в основе современных генеративных систем ИИ и больших языковых моделей. Как отмечают исследователи в статье, предварительное обучение может ускорить вывод, «но также может препятствовать изучению новой физики».
Пока что метод был протестирован только на симуляциях. Следующим шагом станет его применение к реальным астрономическим наблюдениям. Команда считает, что трансферное обучение может стать важным инструментом для будущих космологических обзоров, которые, как ожидается, соберут беспрецедентные объемы высокоточных данных о Вселенной в ближайшие годы.




0 комментариев