Исследователи оцифровали пыльцу 18 000 видов растений
Цветок и оцифрованная пыльца Passiflora cumbalensis из коллекции проекта PollenGEO. Авторы: Доминик Хеммерли и Карлос Харамильо
Команда исследователей из Смитсоновского института тропических исследований приступила к оцифровке изображений пыльцы более чем 18 000 видов тропических растений. Результаты работы опубликованы в журнале PLANTS, PEOPLE, PLANET.
Эти изображения используются для обучения модели машинного обучения, которая сможет идентифицировать пыльцевые зёрна — задача, обычно требующая сотен часов микроскопического анализа экспертами. Оцифрованные данные также откроют новые возможности для исследований пыльцы. База данных под названием PollenGEO будет доступна бесплатно в интернете.
Коллекция пыльцы Смитсоновского института, хранящаяся в Смитсоновском институте тропических исследований (STRI) и Национальном музее естественной истории, включает более 18 000 видов, что делает её одной из крупнейших в мире.
Базы данных пыльцы, такие как PollenGEO, могут служить множеству целей в науке и медицине. Например, быстрая и точная идентификация пыльцы поможет диагностировать аллергию, определить происхождение одежды на месте преступления, исследовать реакцию древних лесов на изменение климата и датировать месторождения углеводородов.
Ценность пыльцы в палеонтологии обусловлена её долговечностью — некоторые зёрна сохраняются сотни миллионов лет, предоставляя точные данные о прошлом Земли. Кроме того, пыльца каждого вида растений уникальна.
Ранее специалисты идентифицировали пыльцевые зёрна вручную под микроскопом, используя иллюстрированные справочники. Этот процесс крайне трудоёмок, особенно в тропиках, где тысячи видов растений остаются неизученными. Также сложно определять пыльцу в древних горных породах, так как многие растения-производители уже вымерли.
Цветок и оцифрованная пыльца Couroupita guianensis из коллекции проекта PollenGEO. Авторы: Лукас Кунья и Карлос Харамильо
Часть команды проекта PollenGEO. Автор: проект PollenGEO
Для решения этих задач более 30 исследователей и студентов STRI под руководством палинолога Карлоса Харамильо оцифровывают всю коллекцию Смитсоновского института. Они загружают более 40 миллионов фотографий пыльцевых зёрен известных видов растений, создавая масштабную базу данных. Эти данные будут использованы для обучения ИИ-моделей, способных идентифицировать пыльцу.
Большинство образцов взято из коллекции Грэма, переданной STRI в 2008 году. Она содержит около 18 000 видов преимущественно тропической пыльцы на более чем 23 000 микроскопических слайдов, каждый из которых сопровождается описательной карточкой. Около 100 волонтёров через Смитсоновский центр транскрипции помогли перенести информацию с карточек в базу данных.
Коллекция также включает собрания Джоан Новицки, Дэйва Рубика и Энрике Морено (Барро-Колорадо), Пола Коллинво (Амазонка) и образцы 650 видов из юго-восточной Мексики (Сиан-Каан). Кроме того, оцифровано около 1000 образцов ископаемой пыльцы из Национального музея естественной истории.
Для обучения ИИ-модели работе с этой базой данных потребовалось сотрудничество экспертов из разных областей — от ботаники до компьютерных наук. Доцент Университета Иллинойса Суранги Пуньясена разрабатывает ИИ-инструменты для проекта.
Команда Харамильо участвует в проекте Trans-Amazon Drilling, изучающем историю Амазонки через анализ пыльцы в кернах. В проекте задействованы исследователи из бразильских университетов и Открытого университета.
Доступность PollenGEO и других онлайн-баз пыльцы превратит её идентификацию из кропотливой микроскопической работы в цифровой и общедоступный процесс.
Андрес Диас провёл вебинар на испанском языке, посвящённый оцифровке 40 миллионов изображений пыльцы.
Дополнительная информация: Карлос Харамильо и др., Digitizing collections to unlock the full potential of palynology: A case study with the Smithsonian palynology collection, PLANTS, PEOPLE, PLANET (2025). DOI: 10.1002/ppp3.70073
Источник: Smithsonian Tropical Research Institute
0 комментариев