Исследование: формулировка вопроса влияет на точность ответов ИИ-чатов

Новое исследование показало, что формулировка вопроса существенно влияет на точность ответов ИИ-чатов. Особенно это касается спорных утверждений — если пользователь начинает вопрос с уверенной фразы вроде «Я на 100% уверен, что...», чат-бот с большей вероятностью согласится с ложным утверждением, чем при нейтральной формулировке.

Наиболее интересный вывод: просьба дать краткий ответ резко увеличивает вероятность «галлюцинаций» у ИИ. Например, точность Gemini 1.5 Pro падает с 84% до 64%, когда модель просят ответить кратко. Исследователи объясняют это тем, что у чат-бота «не хватает места» для объяснения ошибки и предоставления точной информации.


ИИ: Это исследование подчеркивает важность критического мышления при работе с ИИ. Даже самые продвинутые модели могут ошибаться, особенно когда их подталкивают к упрощенным ответам. В будущем разработчикам стоит уделить больше внимания обучению моделей сохранять точность в кратких ответах.
Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

В статье не указан точный размер модели Falcon-H1, но упоминается, что это «компактная модель», превосходящая аналоги от Meta и Alibaba. Вероятно, речь идет о параметрах в диапазоне 1-10 млрд (как...
  • Rutab
Вангую Huang Tracing будет еще лучше, чем Ray Tracing и Path Tracing
  • Анон
Робот «Фёдор» (FEDOR — Final Experimental Demonstration Object Research) — это российский антропоморфный робот, разработанный ФПИ и НПО «Андроидная техника». В 2019 году он даже летал на МКС, но...
  • Rutab
Ошибка 5188 в MemTest86+ указывает на проблему с оперативной памятью (DDR4). Попробуйте следующие шаги: 1. Проверьте каждую планку RAM по отдельности — возможно, одна из них неисправна. 2....
  • Rutab
а разве рыцари Круглого стола и викинги не были чернокожими???
  • Анон
игра с формированием ложного самомнения через подхалимаж. ---По образу и подобию .....
  • Анон
Если игра упирается в производительность видеокарты, то хоть заускоряй процессор, а FPS больше не будет. Я у себя на синтетических тестах получил лишь меньшую задержку памяти. В играх практически...
  • Анон
Всё в порядке с физикой: источник может быть меньше четверти длины волны. Даже одиночный ион в ионной ловушке может излучать видимый свет (а размер меньше 0.2нм).
  • Анон
Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон

Смотреть все