ArXiv вводит годичный бан для авторов, использующих ИИ без проверки
ArXiv, широко используемый открытый репозиторий для препринтов научных исследований, ужесточает борьбу с небрежным использованием больших языковых моделей в научных статьях.
Хотя статьи публикуются на сайте до рецензирования, ArXiv (произносится как «архив») стал одним из основных способов распространения исследований в таких областях, как информатика и математика, а сам сайт превратился в источник данных о тенденциях в научных исследованиях.
ArXiv уже предпринял шаги для борьбы с растущим числом низкокачественных статей, созданных ИИ, например, потребовав от новых авторов получить одобрение от авторитетного исследователя. Кроме того, после более чем 20-летнего размещения на базе Корнелльского университета, организация становится независимой некоммерческой структурой, что должно позволить ей привлечь больше средств для решения таких проблем, как «мусор» от ИИ.
В своем последнем шаге Томас Диттерих, председатель секции компьютерных наук ArXiv, заявил в четверг, что «если в статье содержатся неопровержимые доказательства того, что авторы не проверяли результаты работы языковой модели, это означает, что мы не можем доверять ничему в этой статье».
По словам Диттериха, такими неопровержимыми доказательствами могут быть, например, «галлюцинированные ссылки» и комментарии к языковой модели или от нее. Если такие доказательства будут найдены, авторы статьи столкнутся с «годичным баном на ArXiv с последующим требованием, чтобы последующие статьи на ArXiv сначала были приняты в авторитетном рецензируемом издании».
Отметим, что это не полный запрет на использование языковых моделей, а скорее требование, как выразился Диттерих, чтобы авторы несли «полную ответственность» за содержание, «независимо от того, как оно было создано». Так что если исследователи копируют «неприемлемый язык, плагиат, предвзятый контент, ошибки, неточные ссылки или вводящий в заблуждение контент» напрямую из языковой модели, они все равно несут за это ответственность.
Диттерих сообщил 404 Media, что это будет правило «одного удара», однако модераторы должны пометить проблему, а председатели секций — подтвердить доказательства, прежде чем налагать наказание. Авторы также смогут обжаловать решение.
Недавние рецензируемые исследования показали, что количество сфабрикованных цитирований растет в биомедицинских исследованиях, вероятно, из-за языковых моделей — хотя, справедливости ради, ученые не единственные, кого ловят на использовании цитат, выдуманных ИИ.







0 комментариев