ИИ и климат: создан эталонный набор данных для точного учета выбросов парниковых газов
Визуальная иллюстрация руководства GHGP. Автор: Scientific Data (2025). DOI: 10.1038/s41597-025-05664-8
Крупные компании в ЕС по закону обязаны отчитываться о своих выбросах парниковых газов (ПГ). Однако ручной сбор этой информации из объемных PDF-отчетов об устойчивом развитии — процесс медленный и подверженный ошибкам. Многие команды пытаются ускорить его с помощью автоматизации, например, используя большие языковые модели (LLM) — системы ИИ, которые читают текст и выдают ответы.
Однако координатор проекта и постдокторант Лаборатории социальных данных и искусственного интеллекта (SODA Lab) доктор Мальте Ширхольц призывает к осторожности. «При использовании методов автоматического извлечения легко полностью доверять результатам LLM и упускать из виду ошибки измерений, которые возникают часто».
Поскольку тенденция к увеличению автоматизации многообещающа, но в то же время рискованна, исследовательская группа Greenhouse Gas Insights and Sustainability Tracking (GIST) взялась за создание надежного ориентира для сбора данных о выбросах.
Золотой стандарт для записи данных о выбросах
В статье, опубликованной в Scientific Data, группа представляет эталонный набор данных «золотого стандарта» для извлечения данных о выбросах ПГ. Набор данных основан на отчетах об устойчивом развитии компаний из индекса MSCI World Small Cap и немецкого DAX.
«Основная задача заключалась в извлечении значений выбросов парниковых газов из PDF-файлов в таблицу, — говорит Ширхольц. — То, что сначала казалось простым, оказалось на удивление сложным».
В многоэтапном процессе эксперты по устойчивым финансам из LMU и Deutsche Bundesbank совместно с методологами определили строгие правила аннотирования, провели несколько раундов извлечения и проверки, а также собрали экспертные дискуссионные группы.
«Если вам нужен набор данных, который одновременно точен и позволяет проводить сравнения между компаниями, вам необходимы четкие правила и множество циклов обратной связи на протяжении всего процесса аннотирования данных, — говорит Джейкоб Бек, руководивший работой по аннотированию. — В итоге некоторые неоднозначные случаи все же потребовали обсуждения в экспертной группе».
Многие компании не предоставляют достаточной документации
Исследователь устойчивых финансов доктор Андреас Диммельмайер (консорциум GreenDIA) не был удивлен. «Трудноразрешимые случаи проистекают не только из сложных и частично противоречивых протоколов отчетности, но также из-за отсутствия контекста и неполного раскрытия информации в отчетах компаний. Многие компании в нашей выборке не раскрывали данные о выбросах в соответствии с установленными рамками отчетности и расчета».
Команда также отметила, что около половины отчетов вообще не содержали пригодных для использования данных о парниковых газах. Когда выбросы все же указывались, они чаще всего относились к прямым выбросам и косвенным выбросам от потребления энергии. Данные о других косвенных выбросах, например, возникающих в цепочке поставок или от путешествий и транспорта, редко были полными.
Набор данных вместе со скриптами и дополнительными материалами предлагает прозрачную, тщательно отобранную основу для оценки автоматизированных подходов к отчетности в области устойчивого развития. Делая предположения и решения явными, он позволяет проводить честные сравнения методов и более четко сообщать о неопределенности аннотирования. Группа GIST надеется, что этот ресурс поможет исследователям и практикам более честно измерять прогресс и закрывать критические пробелы в данных на пути к нулевым выбросам.
Больше информации: Jacob Beck et al, Addressing data gaps in sustainability reporting: A benchmark dataset for greenhouse gas emission extraction, Scientific Data (2025). DOI: 10.1038/s41597-025-05664-8
Источник: Ludwig Maximilian University of Munich
ИИ: В 2025 году проблема достоверности экологических данных становится все острее. Создание таких проверенных наборов данных — важный шаг к тому, чтобы заявления компаний о «зелености» подкреплялись реальными, а не просто удобными цифрами. Это особенно актуально на фоне ужесточения регулирования и растущих ожиданий со стороны инвесторов и потребителей.
0 комментариев