LexicMap: новый алгоритм позволяет за минуты искать последовательности ДНК в миллионах микробных геномов

/ НаукаНовости / Наука

LexicMap. Автор: Карен Арнотт/EMBL-EBI

Новый инструмент для выравнивания последовательностей ДНК, LexicMap, позволяет исследователям искать определённые последовательности ДНК среди миллионов бактериальных и архейных геномов всего за несколько минут. Это помогает учёным отслеживать вспышки заболеваний, изучать устойчивость к антибиотикам и понимать микробное разнообразие.

Открытые базы данных, такие как Европейский архив нуклеотидов (ENA), содержат более 2,4 миллиона бактериальных геномов, и это число продолжает быстро расти. До сих пор поиск по этим обширным ресурсам был медленным и требовал значительных вычислительных мощностей, что ограничивало возможности учёных.

Новая статья, опубликованная в журнале Nature Biotechnology, представляет инновационный алгоритм. Используя новаторский метод индексирования генетических данных, LexicMap позволяет исследователям быстро искать последовательности ДНК или мутации в растущих мировых базах данных ДНК. Это открывает новые возможности в эпидемиологии, экологии и эволюционной биологии.

«Эволюция постепенно меняет гены через мутации, поэтому биологи часто хотят просканировать все мировые данные ДНК, чтобы найти совпадения и понять, как они отличаются через мутации», — сказал Замин Икбал, профессор алгоритмической и микробной геномики Университета Бата. «Поскольку взрыв данных опередил наши алгоритмы, нам приходилось мириться с поисковыми системами, которые ищут лишь в части наших данных».

Преодоление барьера масштабируемости

В течение последнего десятилетия команда, стоящая за LexicMap, разрабатывала высококачественные ресурсы данных для исследовательского сообщества и параллельно создавала улучшенные алгоритмы поиска для микробной ДНК. Они также работают в рамках глобального консорциума AllTheBacteria, чтобы собрать и аннотировать все 2,4 миллиона бактериальных и архейных геномов в ENA. LexicMap — это первый алгоритм выравнивания, который может быстро искать все эти данные с низкой вычислительной нагрузкой.

«Поиск от Google стал рутинной частью современной жизни, и мы не можем представить работу с интернетом без него», — сказал Вэй Шэнь, доцент Чунцинского медицинского университета. «Выравнивание с базой данных ДНК — это биологический эквивалент поиска Google, и LexicMap теперь делает это масштабируемым до полного объёма глобальных бактериальных данных. Если вы обнаружили новый ген устойчивости к лекарствам, вы, возможно, захотите узнать, насколько он распространён среди бактерий, и теперь вы можете искать его по мировым данным всего за несколько минут».

Отслеживание микробных угроз

Благодаря упрощению поиска по микробным геномам, LexicMap открывает новые возможности для исследований и общественного здравоохранения.

«Возможность искать все общедоступные бактериальные геномы за минуты меняет то, что возможно», — сказал Джон Лис, руководитель группы в EMBL-EBI. «Если вы разрабатываете новый антибиотик и обнаруживаете мутацию устойчивости, вам нужно знать, насколько она распространена в реальном мире. Теперь, впервые, вы можете искать среди более 2 миллионов геномов — всей глобальной коллекции — за минуты, чтобы выяснить это».

Инструмент LexicMap уже интегрирован в проект AllTheBacteria, который курирует и индексирует высококачественные сборки всех известных бактериальных геномов. Это даёт исследователям простой способ изучения одной из крупнейших коллекций микробной ДНК, когда-либо собранных.

Больше информации: Wei Shen et al, Efficient sequence alignment against millions of prokaryotic genomes with LexicMap, Nature Biotechnology (2025). DOI: 10.1038/s41587-025-02812-8

Источник: European Molecular Biology Laboratory

Подписаться на обновления Новости / Наука
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Все комментарии - Наука