Новый метод ИИ создаёт синтетические изображения для борьбы с инвазивными растениями
Сообщество полыни, заражённое молочаем лозным (панель a), и крупный план соцветия молочая (панель b). Автор: Scientific Data (2025). DOI: 10.1038/s41597-025-05094-6
Одно инвазивное растение ежегодно обходится американским фермерам в 35 миллионов долларов (~2,8 млрд рублей). Теперь команда исследователей использует искусственный интеллект, чтобы держать его под контролем.
Учёные из Университета Карнеги-Меллон совместно с коллегами из природоохранного ранчо в Монтане разработали метод, который обучает модели машинного обучения более эффективному обнаружению инвазивных видов даже при ограниченных данных. Исследование опубликовано в журнале Scientific Data.
Молочай лозный — ядовитый сорняк с мелкими зелёными цветами, способный нанести серьёзный ущерб фермам и природным экосистемам. Токсичный для скота, он может сделать целые сенокосные угодья непригодными для использования, вытесняя местные растения. По оценкам исследователей, ежегодные убытки от него в производстве говядины и сена превышают 35 миллионов долларов (~2,8 млрд рублей).
Но затраты выходят далеко за финансовые рамки. По мере сокращения пастбищ сокращаются и запасы продовольствия. Распространение инвазивных видов ведёт к увеличению использования пестицидов. Исчезают местные растения, теряют среду обитания опылители и птицы, а экосистема начинает разрушаться. То, что начинается как сорняк на пастбище, быстро может превратиться в угрозу для самой земли.
Выявление, мониторинг и искоренение инвазивных видов — приоритет для сельского хозяйства, природоохранных организаций и экологов, но эта задача требует много времени и средств. ИИ мог бы помочь, но учёным не хватает данных для разработки инструмента, способного эффективно идентифицировать и отслеживать эти растения.
«Эти инвазивные растения — серьёзная проблема, — говорит Руслан Салахутдинов, профессор Школы компьютерных наук CMU. — Молочай лозный может разрушить окружающие экосистемы. Создание инструмента машинного обучения для помощи было сложной задачей, потому что у нас не было большого количества данных об этом растении, даже в интернете».
Салахутдинов — профессор компьютерных наук UPMC в Департаменте машинного обучения (MLD). Он работал с Брэндоном Трабукко, аспирантом MLD; Максом Гуринасом из Гарвардского университета; и Кайлом Доэрти, научным сотрудником MPG Ranch, который управляет более чем 15 000 акрами природоохранных земель в западной Монтане для исследований. Учёные MPG Ranch уже использовали дроны и инструменты ИИ для более детального картирования местоположения растений. Хотя Доэрти называет себя «гиком ИИ», сотрудничество с лабораторией Салахутдинова расширило его знания в этой области.
Исследователи SCS хотели использовать новые генеративные инструменты ИИ для улучшения существующих моделей, обученных обнаруживать молочай лозный с помощью изображений с дронов. Салахутдинов и Трабукко задались вопросом, могут ли синтетические изображения этого растения, созданные ИИ, обеспечить необходимые данные для повышения эффективности моделей.
Учёные разработали новую технику под названием DA-Fusion, которая использует передовые модели ИИ для создания более полезных обучающих изображений. Обычно для расширения набора данных исследователи вносят небольшие изменения в существующие изображения, например, обрезают или переворачивают их. DA-Fusion идёт дальше, изменяя объект или фон изображения. Например, если на исходной фотографии показан молочай лозный, растущий в поле, DA-Fusion может сгенерировать изображение того же сорняка в лесу или на травяном поле в другой сезон.
DA-Fusion создал разнообразные обучающие данные о молочае лозном в различных погодных условиях, например, под снегом или во время весеннего цветения. Это избавило экологов в Монтане от необходимости выходить на сбор данных в любую погоду.
«Затраты на эффективное управление природоохранным ранчо, таким как MPG, могут быть довольно высокими, и во многом это связано с трудом, необходимым для доступа к удалённым районам и оценки наличия таких растений, как молочай лозный, — сказал Гуринас. — Методы машинного обучения, подобные разработанному нами, позволяют добиться определённой степени автоматизации, что делает природоохранные мероприятия на более обширных территориях более экономически осуществимыми».
Улучшая разнообразие и качество обучающих данных, исследователи могут повысить точность моделей машинного обучения с меньшим количеством примеров. Учёные согласны, что установление этой связи между экологами и исследователями машинного обучения — важный шаг для будущего сельского хозяйства и экологии.
«Самое интересное в наборах данных, которые мы создаём, — их уникальность. Не так много экологических наборов данных доступно сообществу машинного обучения, — сказал Доэрти. — Думаю, люди заинтересованы в том, чтобы оказывать влияние. Вы можете решить проблему экологов-реставраторов и бороться с изменением климата. Это важная работа, которую необходимо продвигать».
Доэрти и его коллеги из MPG Ranch сделали свой набор данных о молочае лозном общедоступным для сообщества машинного обучения. Открыто делясь данными, они надеются ускорить усилия по обнаружению и контролю других инвазивных видов.
«Эти задачи — одни из самых важных, с которыми мы сталкиваемся как общество, — сказал Трабукко. — Проблемы, подобные молочаю лозному, очень недооценены, и, возможно, достижения в области машинного обучения помогут нам так же, как эти инструменты решают другие проблемы и открывают новые возможности».
Дополнительная информация: Kyle Doherty et al, Ground-truthed and high-resolution drone images of the leafy spurge weed plant (Euphorbia esula), Scientific Data (2025). DOI: 10.1038/s41597-025-05094-6
Источник: Carnegie Mellon University
0 комментариев