Искусственный интеллект превзошел человека по объему контента в интернете
В развитии, которое не удивит никого, кто ощущает растущую волну «AI-помоев», новое исследование указывает, что контент, созданный искусственным интеллектом, теперь превзошел работу людей в интернете. Однако есть и хорошая новость — кажется, что этот поток достиг плато.
Исследовательская компания Five Percent опубликовала новую техническую документацию, анализирующую онлайн-контент, опубликованный в период с января 2020 года по май 2025 года. Результаты показывают, что материалы, созданные с помощью инструментов машинного обучения, изначально обогнали контент, написанный людьми, в конце прошлого года.
Однако данные также демонстрируют, что доля материалов, сгенерированных ИИ, вышла на плато. Фактически, быстрый рост AI-контента начинает замедляться в данных примерно с середины 2023 года.
Возникают два непосредственных вопроса. Во-первых, почему контент ИИ достиг плато? Во-вторых, насколько точным может быть это исследование? Five Percent рассматривает оба этих вопроса.
«Хотя AI-статьи резко выросли после запуска ChatGPT, мы не видим продолжения этой тенденции. Вместо этого доля статей, сгенерированных ИИ, оставалась относительно стабильной в течение последних 12 месяцев. Мы предполагаем, что это связано с тем, что практики обнаружили, что AI-статьи плохо работают в поиске, как показало отдельное исследование», — говорится в исследовании.
Итак, это возможное объяснение плато. Google делает довольно неплохую работу по отсеиванию AI-помоев, если вы можете в это поверить.
Но что с точностью? В исследовании использовался только один алгоритм обнаружения ИИ — бесплатный от Surfer. Это не кажется очень надежным. Однако Five Percent заявляет, что протестировала алгоритм на 15 000 статьях, опубликованных между 2020 и 2022 годами, которые в значительной степени можно считать написанными людьми, и результат показал предполагаемый уровень ложных срабатываний 4,2%.
Что касается оценки ложноотрицательных результатов, авторы использовали GPT-4o от OpenAI для генерации 6 009 статей и пропустили их через Surfer, обнаружив, что он правильно определил 99,4% статей как написанные ИИ.
Five Percent объясняет свою методологию в том, как GPT-4o был запрограммирован на генерацию тестовых статей, но это, очевидно, никогда не сможет полностью имитировать огромный диапазон промптов, которые использовались в реальном мире. Таким образом, вопросы к общей точности исследования остаются.
Иными словами, может ли улучшение качества AI-контента означать, что его труднее обнаружить, и, следовательно, объяснить эффект плато? Трудно сказать наверняка.
Тем не менее, по крайней мере правдоподобно, что Google преуспевает в подавлении хотя бы части AI-помоев, и это само по себе мотивирует издателей контента придерживаться более дорогих людей.
0 комментариев