Директор Internet Archive предупреждает: блокировка архивов веб-сайтов угрожает исторической памяти
Директор некоммерческой организации Internet Archive Марк Грэм выступил с предупреждением: блокировка веб-архивов, таких как Wayback Machine, со стороны крупных сайтов угрожает сохранению публичной истории интернета. По его словам, проблема не в сохранении веба, а в его потере.
В блоге на TechDirt Грэм отметил, что такие издания, как Reddit, The New York Times и The Guardian, начали блокировать доступ архиву, опасаясь скрапинга данных для обучения искусственного интеллекта. «Эти опасения понятны, но необоснованны», — заявил он, подчеркнув, что «Wayback Machine создан для человеческих читателей».
Грэм утверждает, что Internet Archive использует ограничение скорости запросов, фильтрацию и мониторинг, чтобы остановить крупномасштабных ботов, крадущих данные. Команда также следит за новыми способами злоупотреблений, чтобы предотвратить массовый сбор информации в будущем.
Какими бы ни были законные опасения людей по поводу генеративного ИИ, библиотеки — не проблема, а блокировка доступа к веб-архивам — не решение; это создает серьезный риск для публичных записей.
Он предупреждает, что блокировка усилий по сохранению ведет к серьезным непреднамеренным последствиям: журналисты теряют инструменты для проверки фактов, исследователи — доказательства, а веб становится более хрупким и фрагментированным, что упрощает переписывание истории.
Интересный факт: Internet Archive, основанный в 1996 году, хранит более 800 миллиардов веб-страниц в своей коллекции Wayback Machine. Помимо веб-архивов, организация также сохраняет миллионы книг, аудиозаписей, видео и программного обеспечения, выступая в роли цифровой библиотеки для будущих поколений. В условиях растущего давления со стороны правообладателей и развития ИИ миссия архива по сохранению цифрового наследия становится как никогда актуальной.








0 комментариев