Creative Commons поддержала идею платного сканирования сайтов для ИИ
Некоммерческая организация Creative Commons (CC), известная своими открытыми лицензиями, заявила о «осторожной поддержке» систем «pay-to-crawl» («плати за сканирование»). Эта технология позволит автоматически компенсировать владельцам сайтов использование их контента веб-краулерами, которые собирают данные для обучения искусственного интеллекта.
В июле 2025 года CC представила проект CC Signals, призванный создать правовые и технические рамки для обмена данными между их владельцами и разработчиками ИИ. Теперь организация делает следующий шаг, признавая потенциал «платного сканирования» для поддержки издателей.
Реализованная ответственно, система pay-to-crawl может стать способом для веб-сайтов поддерживать создание и распространение своего контента... сохраняя его публичную доступность там, где в противном случае он мог бы не распространяться или исчезнуть за ещё более строгими платными стенами, — говорится в заявлении CC.
Раньше сайты бесплатно позволяли поисковым роботам индексировать контент, так как это привлекало трафик из поисковиков. Однако с появлением ИИ-ассистентов, которые дают ответ, не отправляя пользователя на исходный сайт, эта модель рушится, нанося ущерб издателям. Система платного сканирования могла бы стать решением, особенно для небольших издателей, не имеющих возможности вести индивидуальные переговоры с гигантами вроде OpenAI или Meta, как это делают крупные медиахолдинги.
При этом Creative Commons отмечает и риски: такая система может привести к концентрации власти в интернете и ограничить доступ к информации для исследователей, некоммерческих организаций и образовательных учреждений. Организация предлагает ряд принципов для ответственного внедрения, включая отказ от установки «pay-to-crawl» по умолчанию для всех сайтов, возможность регулирования доступа, а не только его блокировки, и обеспечение открытости и совместимости стандартов.
Идею «платного сканирования» продвигает компания Cloudflare. Microsoft также строит рыночную площадку для издателей, а стартапы вроде ProRata.ai и TollBit разрабатывают свои решения. Кроме того, набирает популярность стандарт Really Simple Licensing (RSL), который позволяет сайтам указывать, какие части контента можно сканировать. Этот стандарт уже поддержали Cloudflare, Akamai, Fastly, Yahoo и другие. Creative Commons также объявила о поддержке RSL в рамках своего проекта CC Signals.
Интересный факт: Creative Commons, основанная в 2001 году, изначально создавалась для решения проблемы авторского права в цифровую эпоху, предоставив авторам гибкие инструменты для лицензирования своих работ. Теперь организация пытается адаптировать эти принципы к новой реальности, где основными «потребителями» контента становятся не люди, а алгоритмы искусственного интеллекта.
* Meta, Facebook и Instagram запрещены в России.







0 комментариев