ИИ ускорит оцифровку гербариев: нейросети точно определяют место сбора растений
Исследователи из Университета Северной Каролины в Чапел-Хилл доказали, что современный искусственный интеллект может с высокой точностью определять место сбора ботанических образцов. Этот процесс, называемый геопривязкой, является одним из самых трудоёмких этапов в оцифровке коллекций естественной истории.
Исследовательская группа проверяет образец растения в гербарии UNC. Автор: Шанна Оберайтер
Согласно новому исследованию, опубликованному в журнале Nature Plants, большие языковые модели (LLM) справляются с этой задачей с точностью, близкой к человеческой, но при этом значительно быстрее и дешевле.
Как ИИ меняет геопривязку
«Наше исследование показывает, как большие языковые модели могут взять на себя одно из самых серьёзных узких мест в оцифровке ботанических коллекций, — сказал Юйян Се, ведущий автор работы и постдокторант кафедры биологии UNC. — Мы пионеры в использовании этих инструментов для геопривязки, и этот прорыв ускорит оцифровку образцов растений, открывая новые возможности для экологических исследований».
Команда выяснила, что LLM не только выполняют геопривязку с ошибкой менее 10 километров, превосходя традиционные методы, но и делают это за малую долю времени и стоимости.
«Недавние достижения в области больших языковых моделей потенциально могут трансформировать процесс геопривязки, сделав его быстрее и точнее, — отметил Сяо Фэн, автор-корреспондент исследования и доцент кафедры биологии UNC. — Это даёт исследователям беспрецедентные возможности для углубления нашего понимания глобального распределения биоразнообразия».
Значение для исследований биоразнообразия
Значение этого открытия огромно. По оценкам, в мире существует от 2 до 3 миллиардов гербарных образцов, но оцифрована лишь малая их часть. Без цифровых записей и пространственных данных учёные сталкиваются с серьёзными ограничениями в отслеживании потери биоразнообразия, понимании перемещения видов из-за изменения климата и анализе сдвигов в экосистемах.
Внедрение геопривязки на основе ИИ позволит вскоре быстро оцифровать обширные коллекции естественной истории, которые до сих пор оставались в значительной степени недоступными.
«Эта технология позволяет нам раскрыть миллионы записей, которые сейчас лежат в шкафах, — сказал Юйян Се. — С помощью больших языковых моделей мы можем быстро оцифровать данные о растительных образцах, которые будут иметь решающее значение для решения глобальных экологических проблем».
Традиционные подходы к геопривязке полагаются на ручную интерпретацию, специализированное программное обеспечение или многоэтапную проверку экспертами. Исследование UNC является одним из первых, где LLM применяются для этой задачи и демонстрируют превосходство над существующими методами по точности, эффективности и масштабируемости. Этот новый подход открывает двери для оцифровки коллекций естественной истории с ранее недостижимой скоростью.
Больше информации: Using large language models to address the bottleneck of georeferencing natural history collections, Nature Plants (2025). DOI: 10.1038/s41477-025-02162-y
Источник: University of North Carolina at Chapel Hill
Интересный факт: Гербарии — это не просто коллекции засушенных растений. Они служат уникальными «капсулами времени», хранящими информацию о растительном мире прошлого. Например, образцы, собранные сотни лет назад, сегодня помогают учёным изучать, как изменился климат и состав атмосферы, анализируя размеры устьиц на листьях или изотопный состав тканей.















0 комментариев