Глава AI-подразделения AMD раскритиковала Claude Code: «Стал ленивым и глупым»

Искусственный интеллект Claude от компании Anthropic, считающийся одним из сильнейших инструментов для помощи в программировании, столкнулся с волной критики после недавнего обновления. Пользователи жалуются, что модель стала «ленивее» и менее эффективной при работе со сложным кодом.

Среди недовольных — Стелла Лоренцо (Stella Laurenzo), руководительница направления искусственного интеллекта в AMD. Она заявила, что после февральского обновления Claude Code стал «относиться к написанию кода спустя рукава» и его больше нельзя доверять для решения сложных инженерных задач.

Лоренцо подчеркнула, что проблема носит системный характер и затрагивает всю её рабочую группу. Она предоставила статистику, основанную на анализе 6852 диалогов с Claude Code, включавших 234760 вызовов инструментов и 17871 «цепочку рассуждений» (CoT). Количество случаев, характеризующих «лень» ИИ — таких как преждевременное прерывание цепочки рассуждений или излишние запросы разрешений — резко возросло. Если до 8 марта таких инцидентов не фиксировалось, то сейчас их в среднем около 10 в день.

Claude Code стал «относиться к написанию кода спустя рукава» и его больше нельзя доверять для решения сложных инженерных задач.

Также было отмечено, что модель стала реже перечитывать код перед внесением правок (с 6.6 раз до 2), чаще переписывать целые файлы и совершать больше правок в целом. Подобные жалобы массово появляются и на GitHub: пользователи отмечают, что при поверхностной цепочке рассуждений модель выбирает путь наименьшего сопротивления — редактирует, не прочитав код, останавливается, не завершив задачу, избегает ответственности за ошибки и предлагает простейшие, но не всегда корректные решения.

Лоренцо призвала Anthropic публично объяснить, не сократили ли они количество токенов, выделяемых на «цепочки рассуждений», что могло привести к ухудшению качества кода. Она также предложила компании добавить режим с максимально глубоким анализом для сложных инженерных проектов.

Пока проблема не решена, AMD уже сменила подписку на другой, по словам Лоренцо, более качественный сервис. Какой именно — не уточняется. Основным конкурентом Claude в этой области считается Codex от OpenAI, но превосходит ли он по качеству обновлённую модель Claude, остаётся под вопросом.

ИИ: Ситуация с Claude Code — яркий пример «регрессии» модели после обновления, с которой сталкиваются многие разработчики ИИ. Погоня за оптимизацией затрат (например, сокращение вычислительных ресурсов на «размышления») может напрямую влиять на качество конечного продукта, особенно в такой требовательной сфере, как программирование. Для компаний вроде AMD, чья работа зависит от точности и сложности кода, такая деградация инструмента становится критичной и вынуждает искать альтернативы.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии