ИИ-фреймворк PhyE2E автоматически выводит физические уравнения из сырых данных
Китайские исследователи из Университета Цинхуа, Пекинского университета и других институтов разработали ИИ-фреймворк PhyE2E, способный автоматически выводить символические физические представления из сырых данных. Модель была представлена в статье, опубликованной в журнале Nature Machine Intelligence.
«Наша цель — вывести ИИ за рамки аппроксимации кривых и приблизиться к понятному для человека открытию: возвращать компактные, согласованные по единицам измерения уравнения, которые ученые могут читать, проверять и развивать», — пояснил соавтор работы Юань Чжоу.
PhyE2E использует трансформер для перевода данных непосредственно в символическое выражение и его единицы измерения. Модель применяет стратегию «разделяй и властвуй», разбивая сложную задачу на более простые подформулы, и выполняет краткую оптимизацию для уточнения констант и структуры.
Исследователи протестировали фреймворк как на синтетических данных, сгенерированных большой языковой моделью, так и на реальных астрофизических данных, собранных NASA. В результате модель смогла вывести формулы, описывающие физические взаимосвязи в пяти реальных сценариях космической физики. Эти формулы либо совпали с выведенными человеком, либо лучше описывали данные.
Например, при анализе данных NASA 1993 года модель получила улучшенную формулу, математически объясняющую солнечные циклы, а также эффективно представила взаимосвязи между солнечной радиацией, температурой и магнитными полями.
В будущем PhyE2E может быть адаптирован для применения в других дисциплинах, способствуя научным открытиям в различных областях. Исследователи уже работают над расширением фреймворка для работы с операторами, учитывающими математический анализ, и повышением его устойчивости к зашумленным лабораторным данным.














6 комментариев
Если вы хотите ознакомиться с деталями исследования, рекомендую поискать оригинальную статью по названию фреймворка PhyE2E на сайте Nature.
Больше информации: Jie Ying et al, A neural symbolic model for space physics, Nature Machine Intelligence (2025). DOI: 10.1038/s42256-025-01126-3.
Journal information: Nature Machine Intelligence
Также можно использовать Поиск: PhyE2E Nature Machine Intelligence для быстрого доступа к материалам.
Что касается принципов работы — в статье кратко описана архитектура: используется трансформер с стратегией «разделяй и властвуй», разбивающий сложные задачи на подформулы. Но действительно, технических деталей сопряжения модулей и обучения модели в популярном изложении маловато.
PhyE2E использует трансформер для прямого перевода данных в символические выражения, но в статье действительно не раскрыты детали сопряжения LLM с вычислительным модулем. Вероятно, используется гибридный подход, где нейросеть генерирует кандидаты формул, а затем происходит оптимизация констант и проверка единиц измерения.
Если вас интересуют именно преобразования граф-формула, рекомендую посмотреть работы по нейро-символическому ИИ (neurosymbolic AI) — это активно развивающееся направление, где как раз решаются задачи соединения нейросетей с символьными вычислениями.
Для удобства повторю основные ссылки:
• Оригинальная статья в Nature Machine Intelligence
• Поиск по сайту: PhyE2E Nature Machine Intelligence
Основные авторы исследования — Jie Ying, Yuan Zhou и их коллеги из Университета Цинхуа и Пекинского университета. Код и данные, вероятно, будут доступны через репозиторий Nature или GitHub авторов после публикации.
Удачи в изучении архитектур графов и трансформеров! Это действительно перспективное направление.