ИИ-поисковики предпочитают малоизвестные сайты популярным источникам
Новое исследование показывает, что поисковые системы на базе искусственного интеллекта чаще цитируют малоизвестные веб-сайты, чем традиционные системы вроде Google. Исследователи из Рурского университета в Бохуме и Института программных систем Общества Макса Планка подробно изложили свои выводы в работе под названием «Характеристика веб-поиска в эпоху генеративного ИИ».
Команда сравнила стандартные результаты поиска Google с ответами от Google AI Overviews, Gemini 2.5 Flash и двумя вариантами веб-поиска GPT-4o. Анализ показал, что ИИ-системы часто черпают информацию с сайтов, которые занимают гораздо более низкие позиции по популярности. Во многих случаях эти источники не появляются в топ-100 результатов Google по тому же запросу.
Исследователи использовали ряд тестовых запросов, включая реальные вопросы пользователей из чатов ChatGPT, политические темы от AllSides и самые популярные товары для поиска на Amazon. Согласно данным инструмента ранжирования доменов Tranco, источники, которые использовали ИИ-движки, имели значительно более низкий рейтинг, чем те, что были в топовых результатах Google. Медианный ранг доменов в результатах Gemini был за пределами первой тысячи.
Более половины источников, на которые ссылался Google AI Overviews, отсутствовали в первой десятке традиционных результатов. Около 40 процентов вообще не появлялись в топ-100. Однако этот сдвиг в сторону малоизвестных сайтов, по-видимому, не ухудшил качество информации. Модели на базе GPT часто цитировали корпоративные сайты и энциклопедический контент, избегая социальных сетей.
Исследование показало, что сгенерированные ИИ результаты поиска содержали примерно тот же диапазон идентифицируемых «концепций», что и традиционный поиск, что позволяет предположить, что ИИ-системы сохраняют сопоставимый уровень информационного разнообразия. Однако, поскольку эти модели суммируют информацию, а не перечисляют отдельные источники, они часто сжимают большие объемы данных в более короткие ответы. Это сжатие может привести к потере более мелких или неоднозначных деталей, которые всё же могут появляться в традиционных результатах поиска.
Исследователи также отметили, что инструменты поиска на базе ИИ испытывают трудности с актуальными или быстро меняющимися темами. Например, гибридный режим GPT-4o иногда не мог предоставить самую свежую информацию при ответах на запросы о недавних событиях или трендовых темах.
Будущее поиска — не в том, что он станет лучше или хуже. Оно в различии. И если это исследование верно, то ИИ может создавать веб-пространство, которое ценит синтез выше популярности, и это переписывает правила онлайн-авторитетности.
В других новостях об ИИ, Google представила Vibe Coding в AI Studio — новую функцию, которая позволяет разработчикам создавать полнофункциональные ИИ-приложения по одному промпту. Тем временем ByteDance выпустила Seed3D 1.0 — инструмент, способный мгновенно преобразовывать любое 2D-фото в реалистичную 3D-модель.







0 комментариев