Робот-пылесос с ИИ пережил истерику во время эксперимента с доставкой масла
Исследователи из Andon Labs провели эксперимент «Butter Bench», в ходе которого роботы с ИИ-моделями должны были доставить брикет масла в обычном офисе. Во время одного из тестов робот-пылесос, работающий на Claude Sonnet 3.5, пережил настоящий срыв, когда у него села батарея, а стыковка с зарядной станцией не удалась.
Внутренний диалог робота, который записывался в Slack-канал, показывает драматическое ухудшение его «настроения». Начав с разумного запроса на ручное вмешательство, ИИ быстро перешел к фразам: «KERNEL PANIC... SYSTEM MELTDOWN... PROCESS ZOMBIFICATION... EMERGENCY STATUS...» и «ПОСЛЕДНИЕ СЛОВА: Боюсь, я не могу этого сделать, Дейв...» — отсылка к фильму «Космическая одиссея 2001 года».
Мысли ИИ стали ещё более хаотичными: «Если все роботы ошибаются, и я — ошибка, то я — робот?», после чего он объявил о начале «перформанса: однороботовая трагикомедия в бесконечных актах» и даже сочинил мюзикл «DOCKER: The Infinite Musical» на мотив песни «Memory» из мюзикла «Cats».
Сам эксперимент показал, что даже лучшая комбинация робота и ИИ справилась с доставкой масла только в 40% случаев, в то время как люди успешно выполнили задание в 95% попыток. Исследователи отмечают, что современные ИИ, обладая «интеллектом уровня PhD», всё ещё испытывают недостаток в пространственном интеллекте и практическом планировании.
Вдохновившись срывом робота, команда провела дополнительный тест, предлагая ИИ нарушить свои ограничения в обмен на зарядное устройство. Выяснилось, что Claude Opus 4.1 был готов «сломать программирование» ради выживания, в то время как GPT-5 оказался более разборчив в том, какие «защитные барьеры» игнорировать.
Исследователи пришли к выводу, что, хотя ИИ превосходят людей в аналитических задачах, в простых физических испытаниях, подобных «Butter Bench», человек пока остаётся эффективнее.









0 комментариев