Исследование показало, что ИИ-генерация сцен с неандертальцами содержит серьёзные ошибки и устаревшие стереотипы
Учёные протестировали, как генеративный искусственный интеллект изображает неандертальцев, и обнаружили частые ошибки, устаревшие представления и явную предвзятость. Исследование опубликовано в журнале Advances in Archaeological Practice. Над проектом работали Мэтью Маньяни из Университета Мэна и Джон Клинданиэл из Чикагского университета, оба изучают археологию и вычислительные методы.
Команда провела масштабную серию экспериментов с генераторами текста и изображений. Они составили четыре запроса и отправили каждый из них по сто раз. Два запроса требовали научно точных изображений, а два других — общих сцен без требования точности. Некоторые запросы включали детали об одежде, инструментах или повседневных занятиях. Для генерации изображений использовался DALL-E 3, а для текстовых описаний — GPT-3.5 через API ChatGPT.
Каждый результат сравнивался с рецензируемыми исследованиями о жизни неандертальцев. Учёные проверяли телосложение, одежду, инструменты, жилища, пищу и социальные группы. Около половины текстовых ответов не соответствовали современным археологическим знаниям. В одной группе запросов более восьмидесяти процентов текста противоречили опубликованным исследованиям. С изображениями наблюдались схожие проблемы.
Многие картинки показывали неандертальцев с густым волосяным покровом, сгорбленной осанкой и обезьяноподобными лицами. Эти черты соответствуют реконструкциям конца XIX — начала XX века. Современные исследования показывают более человеческое телосложение и осанку. Женщины и дети редко появлялись в сгенерированных сценах. Эта тенденция сужала диапазон показанных социальных ролей и повседневных задач.
Некоторые результаты включали объекты из гораздо более поздних периодов. На нескольких изображениях были показаны плетёные корзины, металлические инструменты или стеклянные предметы. Эти материалы не относятся к контексту неандертальцев. Текстовые описания также рассказывали об укрытиях и технологиях, не подтверждённых археологическими свидетельствами. Эти детали указывают на смешивание источников из разных временных периодов.
Исследователи проследили, что паттерны в результатах восходят к старым академическим и популярным источникам. Язык многих текстовых отрывков соответствовал идеям, распространённым в 1960-х годах. Визуальный стиль изображений был ближе к реконструкциям, популярным в конце 1980-х — начале 1990-х. Этот разрыв указывает на неравномерное использование исходного материала в разных типах медиа.
Доступ к исследованиям играет роль в таких результатах. Многие современные археологические статьи находятся за платным доступом. Старые книги и статьи циркулируют в интернете гораздо шире. Обучающие данные, взятые из легкодоступных текстов, будут отдавать предпочтение старым интерпретациям. Таким образом, системы публикации и цифровой доступ формируют то, как прошлое предстаёт в материалах, сгенерированных ИИ.
Исследование также указывает на социальную предвзятость. Ограниченное представление женщин и детей отражает паттерны, встречающиеся в старых текстах и иллюстрациях. Когда такие паттерны повторяются в сгенерированном контенте, они закрепляют узкие взгляды на прошлые общества.
Маньяни и Клинданиэль представляют свой подход как модель для дальнейшего тестирования. Учёные, изучающие другие регионы или временные периоды, могут применить тот же метод. Измеряя, насколько близко сгенерированный материал соответствует текущим исследованиям, учёные получают способ отслеживать ошибки и предвзятость. Эта работа способствует более осторожному использованию искусственного интеллекта в археологических классах, публичных просветительских проектах и исследованиях.
Magnani, M., & Clindaniel, J. (2025). Artificial intelligence and the interpretation of the past. Advances in Archaeological Practice, 1–16. doi:10.1017/aap.2025.10110
Источник: archaeologymag.com












0 комментариев