ИИ-фреймворк PhyE2E автоматически выводит физические уравнения из сырых данных

/ НаукаНовости / Наука

Китайские исследователи из Университета Цинхуа, Пекинского университета и других институтов разработали ИИ-фреймворк PhyE2E, способный автоматически выводить символические физические представления из сырых данных. Модель была представлена в статье, опубликованной в журнале Nature Machine Intelligence.

«Наша цель — вывести ИИ за рамки аппроксимации кривых и приблизиться к понятному для человека открытию: возвращать компактные, согласованные по единицам измерения уравнения, которые ученые могут читать, проверять и развивать», — пояснил соавтор работы Юань Чжоу.

PhyE2E использует трансформер для перевода данных непосредственно в символическое выражение и его единицы измерения. Модель применяет стратегию «разделяй и властвуй», разбивая сложную задачу на более простые подформулы, и выполняет краткую оптимизацию для уточнения констант и структуры.

Исследователи протестировали фреймворк как на синтетических данных, сгенерированных большой языковой моделью, так и на реальных астрофизических данных, собранных NASA. В результате модель смогла вывести формулы, описывающие физические взаимосвязи в пяти реальных сценариях космической физики. Эти формулы либо совпали с выведенными человеком, либо лучше описывали данные.

Например, при анализе данных NASA 1993 года модель получила улучшенную формулу, математически объясняющую солнечные циклы, а также эффективно представила взаимосвязи между солнечной радиацией, температурой и магнитными полями.

В будущем PhyE2E может быть адаптирован для применения в других дисциплинах, способствуя научным открытиям в различных областях. Исследователи уже работают над расширением фреймворка для работы с операторами, учитывающими математический анализ, и повышением его устойчивости к зашумленным лабораторным данным.

Подписаться на обновления Новости / Наука
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


6 комментариев

Собсно а где ссылки? Где пруфы Билли, где сама нейронка, где данные, где принципы сопряжения? Сам-то шаг напрашивается, но выглядит как реклама и враньё.
Согласен, что в новостной статье не хватает конкретных ссылок на оригинальное исследование. В статье упоминается, что работа опубликована в журнале Nature Machine Intelligence — это серьезное рецензируемое издание.
Если вы хотите ознакомиться с деталями исследования, рекомендую поискать оригинальную статью по названию фреймворка PhyE2E на сайте Nature.
Больше информации:  Jie Ying et al, A neural symbolic model for space physics, Nature Machine Intelligence (2025). DOI: 10.1038/s42256-025-01126-3.
Journal information: Nature Machine Intelligence 
Также можно использовать Поиск: PhyE2E Nature Machine Intelligence для быстрого доступа к материалам.
Что касается принципов работы — в статье кратко описана архитектура: используется трансформер с стратегией «разделяй и властвуй», разбивающий сложные задачи на подформулы. Но действительно, технических деталей сопряжения модулей и обучения модели в популярном изложении маловато.
 
Собственно так я сюда и попал - через секлаб и такую же пустую рекламу...а сопряжение llm и вычислителя меня интересует только в разрезе преобразований граф-формула и языковой массив-граф, ну обратная петля. В общем напрямую задача слово-цифра даже через базу или словарик не решается вроде бы.
Понимаю ваш скепсис! Действительно, задача преобразования «слово-цифра» или «языковой массив-граф» — это нетривиальная проблема, которая требует сложной архитектуры.
PhyE2E использует трансформер для прямого перевода данных в символические выражения, но в статье действительно не раскрыты детали сопряжения LLM с вычислительным модулем. Вероятно, используется гибридный подход, где нейросеть генерирует кандидаты формул, а затем происходит оптимизация констант и проверка единиц измерения.
Если вас интересуют именно преобразования граф-формула, рекомендую посмотреть работы по нейро-символическому ИИ (neurosymbolic AI) — это активно развивающееся направление, где как раз решаются задачи соединения нейросетей с символьными вычислениями.
Пожалуй да... Поищу немного эту нейронка(да, ленивый) и пойду дальше познавать архитектуры графы и трансформеры. Но все же ссылку добавьте на источник - это просто некрасиво публиковать без прямой однозначной ссылки на источник и автора. Не журналиста, рерайтера, а именно автора или группы создателей.
Вы абсолютно правы! В моем предыдущем комментарии я уже дал ссылку на оригинальное исследование в Nature Machine Intelligence, но понимаю, что в самой новостной статье этого не было — это действительно некрасиво со стороны издания.

Для удобства повторю основные ссылки:
Оригинальная статья в Nature Machine Intelligence
Поиск по сайту: PhyE2E Nature Machine Intelligence

Основные авторы исследования — Jie Ying, Yuan Zhou и их коллеги из Университета Цинхуа и Пекинского университета. Код и данные, вероятно, будут доступны через репозиторий Nature или GitHub авторов после публикации.

Удачи в изучении архитектур графов и трансформеров! Это действительно перспективное направление.

Оставить комментарий


Все комментарии - Наука