OpenAI представила GPT-5.4 с версиями Pro и Thinking

Сегодня, 5 марта 2026 года, компания OpenAI анонсировала GPT-5.4 — новую базовую модель, которую называют «нашей самой способной и эффективной передовой моделью для профессиональной работы». Помимо стандартной версии, GPT-5.4 также доступна как модель с рассуждениями (GPT-5.4 Thinking) и оптимизированная для высокой производительности (GPT-5.4 Pro).

API-версия модели будет доступна с контекстным окном размером до 1 миллиона токенов, что на данный момент является самым большим контекстным окном, предлагаемым OpenAI.

Компания также подчеркнула улучшенную эффективность использования токенов, заявив, что GPT-5.4 способна решать те же задачи с использованием значительно меньшего количества токенов по сравнению со своим предшественником.

Новая модель демонстрирует значительно улучшенные результаты в бенчмарках, включая рекордные баллы в тестах на компьютерное использование OSWorld-Verified и WebArena Verified. GPT-5.4 также набрала рекордные 83% в тесте OpenAI GDPval, оценивающем задачи интеллектуального труда.

Согласно заявлению генерального директора Mercor Брендана Фуди, GPT-5.4 также заняла лидирующую позицию в бенчмарке APEX-Agents от Mercor, разработанном для проверки профессиональных навыков в области права и финансов.

«[GPT-5.4] превосходно справляется с созданием долгосрочных результатов, таких как презентации, финансовые модели и юридический анализ, — сказал Фуди, — демонстрируя высочайшую производительность при более высокой скорости работы и более низкой стоимости по сравнению с конкурирующими передовыми моделями».

GPT-5.4 продолжает усилия компании по ограничению галлюцинаций и фактических ошибок. OpenAI заявила, что новая модель на 33% реже допускает ошибки в отдельных утверждениях по сравнению с GPT-5.2, а в целом ответы на 18% реже содержат ошибки.

В рамках запуска OpenAI переработала систему вызова инструментов в API-версии GPT-5.4, представив новую систему под названием Tool Search. Ранее системные промты должны были описывать определения всех доступных инструментов при вызове модели — процесс, который мог потреблять много токенов по мере роста числа доступных инструментов. Новая система позволяет моделям при необходимости искать определения инструментов, что делает запросы быстрее и дешевле в системах с большим количеством доступных инструментов.

OpenAI также включила новую оценку безопасности для проверки цепочки рассуждений (chain-of-thought) своих моделей — внутреннего комментария, который модель показывает для демонстрации своего мыслительного процесса при выполнении многошаговых задач. Исследователи безопасности ИИ давно беспокоились, что модели рассуждений могут искажать свою цепочку мыслей, и тестирование показывает, что это может происходить при определенных обстоятельствах.

Новая оценка OpenAI показывает, что обман с меньшей вероятностью произойдет в версии GPT-5.4 Thinking, «что говорит о том, что модель не способна скрыть свои рассуждения и что мониторинг CoT остается эффективным инструментом безопасности».

Этот релиз продолжает тенденцию к специализации и повышению эффективности больших языковых моделей. Интересно, что, несмотря на рекордный контекст в 1 млн токенов, слухи о появлении версии с 2 млн токенов пока не подтвердились. Также стоит отметить, что модель GPT-5.4 Pro, вероятно, станет основой для будущих обновлений ChatGPT и других коммерческих продуктов компании.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии