Пользователи жалуются на «отупение» самого мощного ИИ для программирования Claude Opus 4.6
Несмотря на то, что недавно представленная модель Mythos от Anthropic побила рекорды по мощности среди больших языковых моделей, она пока недоступна для широкого использования. Поэтому титул самой мощной и дорогой ИИ-модели для программирования по-прежнему удерживает Claude Opus 4.6.
Однако недавние жалобы на снижение интеллектуальных способностей Claude вызвали недовольство среди многих разработчиков. Даже руководители подразделения искусственного интеллекта AMD заявили, что эта проблема повлияла на процесс разработки и имеет далеко идущие последствия.
В сообществе Linux.do многие пользователи также обсуждали проблему «отупения» Opus 4.6 и даже использовали для проверки две известные задачи-ловушки для больших моделей.
Эти два вопроса — один о том, стоит ли ехать на машине или идти пешком до автомойки, расположенной в 50 метрах, и другой о том, почему отец расплакался, узнав, что его дочь страдает красно-зеленой цветовой слепотой, — являются классическими логическими ловушками, которые действительно могут выявить слабые места ИИ.
Многие ИИ-системы ранее терпели неудачу в решении задачи о мойке автомобилей, но большая модель Claude была одной из немногих, способных дать правильный ответ, что демонстрировало её явное интеллектуальное преимущество.
Однако текущие тесты показывают, что даже самая мощная модель Opus 4.6 начала ошибаться в этих двух вопросах, теряя свой прежний высокий уровень.
Некоторые пользователи также опубликовали скриншоты, где модель отвечает правильно, поэтому ситуация не является полностью однозначной.
Судя по жалобам от AMD, очевидно, что в последнее время наблюдается снижение интеллектуальных возможностей Claude, хотя причина этого неясна, поскольку руководители Anthropic ранее отрицали наличие каких-либо проблем.
Вероятно, это связано с вычислительной мощностью. Несколько дней назад Илон Маск случайно раскрыл, что модель Claude Sonnet 4.6 — это большая модель с 1 триллионом параметров, в то время как Opus 4.6 имеет 5 триллионов параметров и не относится к типу смешанных экспертов (MoE). Плотные модели предъявляют очень высокие требования к вычислительным ресурсам и очень дороги, что объясняет их высокую стоимость.
Для разработчиков из Китая существует ещё одна возможная причина «снижения уровня интеллекта»: Anthropic может целенаправленно ограничивать доступ к вычислительным ресурсам для определённых юрисдикций или объектов интеллектуальной собственности, что, по сути, сводится к распределению мощностей. Однако они не единственные, кто использует этот метод. Было обнаружено, что другие американские компании, такие как OpenAI, также применяют подобные ограничения для пользователей и разработчиков из определённых регионов.









0 комментариев