Anthropic представила флагманскую модель Opus 4.5 с интеграцией в Chrome и Excel

Компания Anthropic в понедельник анонсировала Opus 4.5 — новейшую версию своей флагманской модели. Это последняя модель из серии 4.5, после выпуска Sonnet 4.5 в сентябре и Haiku 4.5 в октябре.

Как и ожидалось, новая версия Opus демонстрирует передовую производительность в ряде тестов, включая тесты на программирование (SWE-Bench и Terminal-bench), использование инструментов (tau2-bench и MCP Atlas) и решение общих задач (ARC-AGI 2, GPQA Diamond).

Примечательно, что Opus 4.5 стала первой моделью, набравшей более 80 процентов в тесте SWE-Bench verified, который считается авторитетным бенчмарком для оценки навыков программирования.

Anthropic также сделала акцент на возможностях Opus по работе с компьютером и электронными таблицами, выпустив ряд параллельных продуктов, демонстрирующих, как модель справляется в этих условиях. Вместе с Opus 4.5 Anthropic сделает свои продукты Claude for Chrome и Claude for Excel — ранее находившиеся в пилотном режиме — более доступными. Расширение для Chrome будет доступно всем пользователям подписки Max, а модель для Excel — пользователям тарифов Max, Team и Enterprise.

Opus 4.5 также получила улучшения памяти для операций с длинным контекстом, что потребовало значительных изменений в том, как модель управляет своей памятью.

«В Opus 4.5 мы улучшили общее качество работы с длинным контекстом во время обучения, но сами по себе большие окна контекста будут недостаточны», — рассказала TechCrunch Дианна На Пенн, руководитель управления продуктами для исследований в Anthropic. «Умение запоминать нужные детали действительно важно в дополнение к просто более длинному окну контекста».

Эти изменения также позволили реализовать давно запрашиваемую функцию «бесконечного чата» для платных пользователей Claude, которая позволит беседам продолжаться без перерыва, когда модель достигнет предела своего контекстного окна. Вместо этого модель будет сжимать свою контекстную память без уведомления пользователя.

Многие из улучшений сделаны с прицелом на агентские сценарии использования, в частности, ситуации, когда Opus действует как ведущий агент, управляющий группой подчиненных агентов на базе Haiku. Управление такими задачами требует надежного контроля над рабочей памятью, и именно здесь улучшения памяти, описанные Пенн, действительно показывают свою ценность.

«Именно здесь такие основы, как память, становятся действительно важными, — говорит Пенн, — потому что Клоду нужно уметь исследовать базы кода и большие документы, а также знать, когда нужно вернуться назад и перепроверить что-то».

Opus 4.5 столкнется с жесткой конкуренцией со стороны других недавно выпущенных передовых моделей, в первую очередь GPT 5.1 от OpenAI (выпущена 12 ноября) и Gemini 3 от Google (выпущена 18 ноября).

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии