MetaGraph: «Google для ДНК» ускоряет генетические исследования
Исследователи из Цюрихской высшей технической школы (ETH Zurich) разработали поисковую систему MetaGraph, которая позволяет ученым мгновенно искать по миллиардам генетических последовательностей в гигантских базах данных, таких как SRA и ENA. Эти архивы содержат около 100 петабайт информации, что сопоставимо со всем текстом в интернете.
До сих пор для поиска в этих репозиториях требовались огромные вычислительные ресурсы. MetaGraph меняет подход, позволяя проводить поиск непосредственно в сырых данных ДНК или РНК, подобно тому, как работает интернет-поисковик. Ученые вводят интересующую генетическую последовательность и за секунды или минуты видят, где она встречается в глобальных базах.
«Это своего рода Google для ДНК», — объясняет профессор Гуннар Реч, специалист по науке о данных.
Система использует передовые математические графы для организации и сжатия данных с коэффициентом около 300 раз, сохраняя при этом всю необходимую информацию. По словам авторов, MetaGraph не только быстрая и точная, но и экономически эффективная: крупные запросы будут стоить около 0.74 доллара США (~59 рублей) за мегабазу.
Инструмент уже доступен для публичного использования и индексирует миллионы последовательностей ДНК, РНК и белков от вирусов, бактерий, грибов, растений, животных и людей. На данный момент проиндексирована почти половина всех доступных глобальных наборов последовательностей.
ИИ: В 2025 году такие инструменты, как MetaGraph, становятся критически важными для обработки экспоненциально растущих объемов генетических данных, открывая новые горизонты в персонализированной медицине и борьбе с патогенами.















0 комментариев