Подход машинного обучения может улучшить результаты поиска гравитационных волн в обсерватории
Пошаговый рабочий процесс нашего предлагаемого конвейера. Каждый шаг подробно описан в тексте §III-B. Автор: arXiv (2024). DOI: 10.48550/arxiv.2412.09832
Поиск закономерностей и снижение уровня шума в больших сложных наборах данных, генерируемых детектором гравитационных волн LIGO, стал проще благодаря работе ученых из Калифорнийского университета в Риверсайде.
Исследователи UCR представили доклад на недавнем семинаре IEEE по большим данным, продемонстрировав новый подход к машинному обучению без учителя для поиска новых закономерностей в данных вспомогательных каналов лазерной интерферометрической гравитационно-волновой обсерватории (LIGO). Эта технология также потенциально применима к крупномасштабным экспериментам с ускорителями частиц и большим сложным промышленным системам.
LIGO — это установка, которая обнаруживает гравитационные волны — кратковременные возмущения в ткани самого пространства-времени, создаваемые ускорением массивных тел. Она была первой, кто обнаружил такие волны от сливающихся черных дыр, подтвердив ключевую часть теории относительности Эйнштейна.
LIGO имеет два широко разнесенных интерферометра длиной 4 км — в Ханфорде, штат Вашингтон, и Ливингстоне, штат Луизиана, — которые работают вместе, чтобы обнаружить гравитационные волны, используя мощные лазерные лучи. Открытия, которые делают эти детекторы, предлагают новый способ наблюдения за Вселенной и решения вопросов о природе черных дыр, космологии и самых плотных состояниях материи во Вселенной.
Каждый из двух детекторов LIGO регистрирует тысячи потоков данных, или каналов, которые составляют выходные данные датчиков окружающей среды, расположенных в местах расположения детекторов.
«Подход к машинному обучению, который мы разработали в тесном сотрудничестве с уполномоченными LIGO и заинтересованными сторонами, позволяет самостоятельно выявлять закономерности в данных», — сказал Джонатан Ричардсон, доцент кафедры физики и астрономии, возглавляющий группу LIGO в Калифорнийском университете в Риверсайде.
«Мы обнаружили, что он чрезвычайно хорошо восстанавливает «состояния» окружающей среды, известные операторам на площадках детекторов LIGO, без какого-либо человеческого вмешательства. Это открывает дверь к новому мощному экспериментальному инструменту, который мы можем использовать для локализации шумовых связей и непосредственного руководства будущими усовершенствованиями детекторов».
Ричардсон объяснил, что детекторы LIGO чрезвычайно чувствительны к любому типу внешних возмущений. Движение грунта и любой тип вибрационного движения — от ветра до океанских волн, ударяющих по побережью Гренландии или Тихого океана — могут повлиять на чувствительность эксперимента и качество данных, что приведет к «сбоям» или периодам повышенных шумовых всплесков, сказал он.
«На объектах постоянно ведется мониторинг условий окружающей среды», — сказал он. «LIGO имеет более 100 000 вспомогательных каналов с сейсмометрами и акселерометрами, зондирующими среду, в которой расположены интерферометры. Разработанный нами инструмент может определять различные состояния окружающей среды, представляющие интерес, такие как землетрясения, микросейсмы и антропогенный шум, по ряду тщательно отобранных и курируемых каналов зондирования».
Вагелис Папалексакис, доцент кафедры компьютерных наук и инженерии, заведующий кафедрой компьютерных наук Ross Family Chair, представил доклад своей группы под названием «Многомерная кластеризация временных рядов для характеристики состояния окружающей среды наземных детекторов гравитационных волн» на 5-м международном семинаре IEEE по инструментам, моделям и вариантам использования больших данных и искусственного интеллекта для инновационных научных открытий, который состоялся в прошлом месяце в Вашингтоне, округ Колумбия. Работа опубликована на сервере препринтов arXiv.
«Наш подход к машинному обучению работает так: мы берем модель, которой поручено идентифицировать закономерности в наборе данных, и позволяем ей находить закономерности самостоятельно», — сказал Папалексакис. «Инструмент смог идентифицировать те же закономерности, которые очень близко соответствуют физически значимым состояниям окружающей среды, которые уже известны операторам и комиссарам на площадках LIGO».
Папалексакис добавил, что команда работала с LIGO Scientific Collaboration, чтобы обеспечить публикацию очень большого набора данных, который относится к анализу, представленному в исследовательской статье. Эта публикация данных позволяет исследовательскому сообществу не только подтвердить результаты команды, но и разработать новые алгоритмы, которые стремятся выявить закономерности в данных.
«Мы выявили интересную связь между внешним шумом окружающей среды и наличием определенных типов сбоев, которые портят качество данных», — сказал Папалексакис. «Это открытие может помочь устранить или предотвратить возникновение такого шума».
Команда организовала и работала по всем каналам LIGO около года. Ричардсон отметил, что публикация данных была крупным начинанием.
Машинное обучение (англ. machine learning, ML) — класс методов искусственного интеллекта, характерной чертой которых является не прямое решение задачи, а обучение в процессе применения решений множества сходных задач. Для построения таких методов используются средства математической статистики, численных методов, математического анализа, методов оптимизации, теории вероятностей, теории графов, различные техники работы с данными в цифровой форме. Различают два типа обучения: Обучение по прецедентам, или индуктивное обучение, основано на выявлении эмпирических закономерностей в данных. Википедия
Ричардсон объяснил, что инструмент, разработанный командой, может извлекать информацию из сигналов многочисленных разнородных датчиков, которые измеряют различные возмущения вокруг площадок LIGO. Инструмент может извлекать информацию в единое состояние, сказал он, которое затем может использоваться для поиска ассоциаций временных рядов, когда возникали проблемы с шумом в детекторах LIGO, и соотносить их с состояниями окружающей среды площадок в это время.
«Если вы можете определить закономерности, вы можете вносить физические изменения в детектор — например, заменять компоненты», — сказал он. «Мы надеемся, что наш инструмент сможет пролить свет на пути физического шумового взаимодействия, которые позволят вносить действенные экспериментальные изменения в детекторы LIGO. Наша долгосрочная цель — использовать этот инструмент для обнаружения новых ассоциаций и новых форм состояний окружающей среды, связанных с неизвестными шумовыми проблемами в интерферометрах».
Пуян Гударзи, аспирант, работающий с Ричардсоном и являющийся соавтором статьи, подчеркнул важность публикации набора данных в открытом доступе.
«Обычно такие данные являются собственностью», — сказал он. «Тем не менее, нам удалось выпустить масштабный набор данных, который, как мы надеемся, приведет к более междисциплинарным исследованиям в области науки о данных и машинного обучения».
К Ричардсону, Папалексакису и Гударзи в исследовании присоединились Рутуя Гурав, аспирантка, работающая с Папалексакисом; Айзек Келли, студент летнего бакалавриата REU; Анамария Эффлер из обсерватории Ливингстона LIGO; и Барри Бариш, выдающийся профессор физики и астрономии Калифорнийского университета в Риверсайде.
Больше информации: Rutuja Gurav et al, Multivariate Time Series Clustering for Environmental State Characterization of Ground-Based Gravitational-Wave Detectors, arXiv (2024). DOI: 10.48550/arxiv.2412.09832
Источник: University of California - Riverside
0 комментариев