Почему ИИ от Google не может правильно написать слово «Google»: орфографические ошибки AI Overview
Почему ИИ от Google не может правильно написать слово «Google» (и не только)? Согласно AI Overview от Google, в слове Google две буквы «p». Также система утверждает, что в слове «poop» ровно одна буква «r», а в слове «journalism» — две буквы «d», хотя пишет его как «j-o-u-r-n-a-d-i-s-m». Google хотя бы верно определила, что в фамилии президента США одна буква «p», но написала её как «t-r-p-u-m».
Не нужно быть пророком, чтобы предсказать, что обновление поиска Google с упором на ИИ будет воспринято плохо. Это уже случалось. В первый раз, когда Google добавила AI Overviews в поиск, функция ссылалась на сатирические посты The Onion и Reddit, советуя людям есть камни и класть клей на пиццу. На этот раз, когда Google удваивает свои усилия по внедрению генеративного ИИ в свой флагманский продукт, неудивительно, что она снова спотыкается.
«Подсчёт букв в словах — известная проблема для LLM, и мы работаем над её исправлением», — сообщил Google TechCrunch в заявлении по электронной почте.
Эти элементарные орфографические ошибки могут показаться знакомыми. LLM, тип искусственного интеллекта, лежащий в основе чат-ботов и других генераторов текста, не предназначены для понимания правописания. Уже много лет ходит шутка, что когда компания представляет новую модель ИИ, нужно спросить её, сколько букв «r» в слове «strawberry». Эти модели ИИ, которые могут за секунды написать код приложения или решить задачи, ставившие в тупик математиков десятилетиями, в правописании находятся на уровне детсадовца.
Проблемы AI Overview от Google выходят за рамки забавных орфографических ошибок. На прошлой неделе Google уже исправила проблему, когда поиск слова «disregard» выдавал то, что выглядело как словарное определение, но на самом деле было: «Понял. Дайте мне знать, когда у вас будет новый запрос или вопрос!» Однако эти орфографические ошибки остаются забавными именно потому, что их так трудно искоренить.
Как ранее объясняли исследователи, когда мы спрашивали об этих орфографических загадках, ИИ не воспринимает предложения как единицы языка, состоящие из слов и букв. Многие LLM построены на архитектуре трансформеров, которая разбивает текст на токены — это могут быть целые слова, слоги или буквы, в зависимости от модели. Вместо того чтобы «читать» как человек, ИИ преобразует текст в числовые представления самого себя, которые затем контекстуализируются, чтобы помочь ИИ придумать логичный ответ.
Image Credits:TechCrunch
«LLM основаны на архитектуре трансформеров, которая, что примечательно, на самом деле не читает текст. Когда вы вводите запрос, он переводится в кодировку», — рассказал TechCrunch Мэттью Гуздиал, исследователь ИИ и доцент Университета Альберты. «Когда модель видит слово "the", у неё есть одна кодировка того, что означает "the", но она не знает о буквах "T", "H", "E"». Токен-ориентированная архитектура, лежащая в основе LLM, таких как AI Overview от Google, по своей сути ограничена, и исследователи не оптимистичны в отношении того, что проблему правописания можно решить.
«Довольно сложно обойти вопрос о том, что именно должно считаться "словом" для языковой модели, и даже если бы эксперты-люди согласовали идеальный словарь токенов, модели, вероятно, всё равно находили бы полезным "разбивать" вещи ещё дальше», — рассказала TechCrunch Шеридан Фойхт, аспирантка, изучающая интерпретируемость больших языковых моделей в Северо-Восточном университете. «Я предполагаю, что идеального токенизатора не существует из-за такого рода размытости».
Эта проблема не обязательно является срочной для исследователей, поскольку полезность LLM заключается не в их способности писать без ошибок. Однако эти вопиющие провалы помогают нам помнить, что ИИ несовершенен, даже если иногда он может казаться всезнающей силой, превосходящей наше понимание. Мы не можем слепо доверять результатам работы ИИ, не перепроверяя их точность.







0 комментариев