Исследование: простые модели ИИ иногда превосходят сложные в предсказании эффектов генетических изменений
Systema анализирует предсказанные профили после воздействий для выявления последующих эффектов. Автор: Nature Biotechnology (2025). DOI: 10.1038/s41587-025-02777-8
Исследователи из Федеральной политехнической школы Лозанны (EPFL) разработали Systema — новый инструмент для оценки эффективности моделей ИИ в предсказании эффектов генетических возмущений.
Понимание того, как генетические возмущения (когда ученые намеренно изменяют гены, чтобы увидеть, как они влияют на клетки) влияют на клетки, является ключевым для понимания функций генов и их регуляции. Эти знания имеют важное применение в клеточной инженерии и разработке новых методов лечения.
Сегодня ученые могут тестировать множество различных генетических возмущений в лаборатории. Но возможных комбинаций так много, что протестировать их все невозможно.
ИИ и машинное обучение создали возможность использовать информацию из больших биологических наборов данных для предсказания того, что произойдет при изменении гена — даже если это изменение никогда не тестировалось в лаборатории. Но насколько хорошо эти модели действительно работают?
Оценка различных моделей предсказания
Чтобы оценить это, исследователи из Лаборатории машинного обучения для биомедицины (MLBio) EPFL, работающей совместно с Школой компьютерных и коммуникационных наук и Школой наук о жизни, в сотрудничестве с международными коллегами протестировали лучшие модели ИИ. Они использовали данные из десяти различных экспериментов и сравнили их с простыми статистическими подходами.
В исследовании, опубликованном в Nature Biotechnology, команда обнаружила нечто удивительное. Простые подходы показали себя так же хорошо, если не лучше, чем продвинутые модели ИИ на многих наборах данных.
«Наблюдение, что простые подходы работают так же хорошо, как и продвинутые модели ИИ, заставило нас задуматься: действительно ли продвинутые модели понимают, что делают изменения генов? Подходят ли стандартные метрики для оценки этих моделей?» — сказала доцент Мария Брбич, руководитель лаборатории MLBio.
Почему простые методы показали такие хорошие результаты?
Продвинутые модели могут выглядеть лучше, чем они есть на самом деле. Это связано с систематическими различиями между обработанными и необработанными клетками. В этих случаях модели могут не изучать истинные эффекты генетических изменений. Вместо этого они могут просто замечать закономерности, вызванные дизайном эксперимента, или эффекты, которые происходят почти для всех генетических изменений.
Исследователи также обнаружили, что распространенные способы проверки производительности моделей могут вводить в заблуждение. Они часто не учитывают эти систематические различия.
«Чтобы справиться с этим, мы создали инструмент под названием Systema. Он уменьшает влияние систематических смещений и фокусируется на уникальных эффектах каждого генетического возмущения. Systema также упрощает понимание того, что на самом деле делают генетические возмущения», — объяснил Рамон Виньяс Торне, постдокторант лаборатории MLBio и первый автор статьи.
Предсказание сложнее, чем предполагают стандартные метрики
С помощью Systema исследователи обнаружили, что моделям ИИ по-прежнему очень сложно предсказывать эффекты новых генетических изменений. Некоторые модели могли делать правильные предположения, когда гены были частью одного биологического процесса, но в целом задача остается сложной.
Systema помогает отличить модели, которые просто улавливают смещения, от тех, которые действительно понимают, как генетические модификации влияют на клетки.
Исследователи предлагают оценивать модели ИИ на основе их биологической ценности. Это означает изучение того, насколько хорошо предсказания объясняют клеточные признаки.
«В перспективе проведение более масштабных и разнообразных экспериментов поможет улучшить эти предсказания. Кроме того, новые технологии, которые изучают клетки более детально, например, их форму или местоположение, могут помочь нам лучше понять, как изменения генов влияют на клетки и ткани», — заключила Брбич.
Больше информации: Ramon Viñas Torné et al, Systema: a framework for evaluating genetic perturbation response prediction beyond systematic variation, Nature Biotechnology (2025). DOI: 10.1038/s41587-025-02777-8
Источник: Ecole Polytechnique Federale de Lausanne
0 комментариев