Глава AI-подразделения AMD раскритиковала Claude Code: «Стал ленивым и глупым»
Искусственный интеллект Claude от компании Anthropic, считающийся одним из сильнейших инструментов для помощи в программировании, столкнулся с волной критики после недавнего обновления. Пользователи жалуются, что модель стала «ленивее» и менее эффективной при работе со сложным кодом.
Среди недовольных — Стелла Лоренцо (Stella Laurenzo), руководительница направления искусственного интеллекта в AMD. Она заявила, что после февральского обновления Claude Code стал «относиться к написанию кода спустя рукава» и его больше нельзя доверять для решения сложных инженерных задач.
Лоренцо подчеркнула, что проблема носит системный характер и затрагивает всю её рабочую группу. Она предоставила статистику, основанную на анализе 6852 диалогов с Claude Code, включавших 234760 вызовов инструментов и 17871 «цепочку рассуждений» (CoT). Количество случаев, характеризующих «лень» ИИ — таких как преждевременное прерывание цепочки рассуждений или излишние запросы разрешений — резко возросло. Если до 8 марта таких инцидентов не фиксировалось, то сейчас их в среднем около 10 в день.
Claude Code стал «относиться к написанию кода спустя рукава» и его больше нельзя доверять для решения сложных инженерных задач.
Также было отмечено, что модель стала реже перечитывать код перед внесением правок (с 6.6 раз до 2), чаще переписывать целые файлы и совершать больше правок в целом. Подобные жалобы массово появляются и на GitHub: пользователи отмечают, что при поверхностной цепочке рассуждений модель выбирает путь наименьшего сопротивления — редактирует, не прочитав код, останавливается, не завершив задачу, избегает ответственности за ошибки и предлагает простейшие, но не всегда корректные решения.
Лоренцо призвала Anthropic публично объяснить, не сократили ли они количество токенов, выделяемых на «цепочки рассуждений», что могло привести к ухудшению качества кода. Она также предложила компании добавить режим с максимально глубоким анализом для сложных инженерных проектов.
Пока проблема не решена, AMD уже сменила подписку на другой, по словам Лоренцо, более качественный сервис. Какой именно — не уточняется. Основным конкурентом Claude в этой области считается Codex от OpenAI, но превосходит ли он по качеству обновлённую модель Claude, остаётся под вопросом.
ИИ: Ситуация с Claude Code — яркий пример «регрессии» модели после обновления, с которой сталкиваются многие разработчики ИИ. Погоня за оптимизацией затрат (например, сокращение вычислительных ресурсов на «размышления») может напрямую влиять на качество конечного продукта, особенно в такой требовательной сфере, как программирование. Для компаний вроде AMD, чья работа зависит от точности и сложности кода, такая деградация инструмента становится критичной и вынуждает искать альтернативы.







0 комментариев