OpenAI представила GPT-5.4 с версиями Pro и Thinking
Сегодня, 5 марта 2026 года, компания OpenAI анонсировала GPT-5.4 — новую базовую модель, которую называют «нашей самой способной и эффективной передовой моделью для профессиональной работы». Помимо стандартной версии, GPT-5.4 также доступна как модель с рассуждениями (GPT-5.4 Thinking) и оптимизированная для высокой производительности (GPT-5.4 Pro).
API-версия модели будет доступна с контекстным окном размером до 1 миллиона токенов, что на данный момент является самым большим контекстным окном, предлагаемым OpenAI.
Компания также подчеркнула улучшенную эффективность использования токенов, заявив, что GPT-5.4 способна решать те же задачи с использованием значительно меньшего количества токенов по сравнению со своим предшественником.
Новая модель демонстрирует значительно улучшенные результаты в бенчмарках, включая рекордные баллы в тестах на компьютерное использование OSWorld-Verified и WebArena Verified. GPT-5.4 также набрала рекордные 83% в тесте OpenAI GDPval, оценивающем задачи интеллектуального труда.
Согласно заявлению генерального директора Mercor Брендана Фуди, GPT-5.4 также заняла лидирующую позицию в бенчмарке APEX-Agents от Mercor, разработанном для проверки профессиональных навыков в области права и финансов.
«[GPT-5.4] превосходно справляется с созданием долгосрочных результатов, таких как презентации, финансовые модели и юридический анализ, — сказал Фуди, — демонстрируя высочайшую производительность при более высокой скорости работы и более низкой стоимости по сравнению с конкурирующими передовыми моделями».
GPT-5.4 продолжает усилия компании по ограничению галлюцинаций и фактических ошибок. OpenAI заявила, что новая модель на 33% реже допускает ошибки в отдельных утверждениях по сравнению с GPT-5.2, а в целом ответы на 18% реже содержат ошибки.
В рамках запуска OpenAI переработала систему вызова инструментов в API-версии GPT-5.4, представив новую систему под названием Tool Search. Ранее системные промты должны были описывать определения всех доступных инструментов при вызове модели — процесс, который мог потреблять много токенов по мере роста числа доступных инструментов. Новая система позволяет моделям при необходимости искать определения инструментов, что делает запросы быстрее и дешевле в системах с большим количеством доступных инструментов.
OpenAI также включила новую оценку безопасности для проверки цепочки рассуждений (chain-of-thought) своих моделей — внутреннего комментария, который модель показывает для демонстрации своего мыслительного процесса при выполнении многошаговых задач. Исследователи безопасности ИИ давно беспокоились, что модели рассуждений могут искажать свою цепочку мыслей, и тестирование показывает, что это может происходить при определенных обстоятельствах.
Новая оценка OpenAI показывает, что обман с меньшей вероятностью произойдет в версии GPT-5.4 Thinking, «что говорит о том, что модель не способна скрыть свои рассуждения и что мониторинг CoT остается эффективным инструментом безопасности».
Этот релиз продолжает тенденцию к специализации и повышению эффективности больших языковых моделей. Интересно, что, несмотря на рекордный контекст в 1 млн токенов, слухи о появлении версии с 2 млн токенов пока не подтвердились. Также стоит отметить, что модель GPT-5.4 Pro, вероятно, станет основой для будущих обновлений ChatGPT и других коммерческих продуктов компании.







0 комментариев