OpenAI обновила Codex новой версией GPT-5
OpenAI объявила в понедельник о выпуске новой версии GPT-5 для своего ИИ-агента программирования Codex. Компания заявляет, что её новая модель под названием GPT-5-Codex тратит своё «время на размышления» более динамично, чем предыдущие модели, и может заниматься задачей по программированию от нескольких секунд до семи часов. В результате она демонстрирует лучшую производительность в тестах агентного кодирования.
Новая модель уже внедряется в продукты Codex — которые доступны через терминал, IDE, GitHub или ChatGPT — для всех пользователей ChatGPT Plus, Pro, Business, Edu и Enterprise. OpenAI сообщает, что планирует сделать модель доступной для клиентов API в будущем.
Обновление является частью усилий OpenAI сделать Codex более конкурентоспособным по сравнению с другими продуктами ИИ-кодирования, такими как Claude Code, Cursor от Anysphere или GitHub Copilot от Microsoft. Рынок инструментов ИИ-кодирования стал значительно более насыщенным за последний год из-за высокого спроса со стороны пользователей. Cursor превысил $500 млн (40 млрд рублей) годового регулярного дохода в начале 2025 года, а Windsurf, аналогичный редактор кода, стал объектом хаотичной попытки поглощения, в результате которой его команда разделилась между Google и Cognition.
OpenAI утверждает, что GPT-5-Codex превосходит GPT-5 на SWE-bench Verified — тесте, измеряющем агентные способности к кодированию, а также на тесте, измеряющем производительность при рефакторинге кода из крупных устоявшихся репозиториев.
(Источник: OpenAI)
Компания также сообщает, что обучала GPT-5-Codex для проведения код-ревью и попросила опытных инженеров-программистов оценить комментарии модели к обзорам. По сообщениям, инженеры обнаружили, что GPT-5-Codex реже отправляет некорректные комментарии, при этом добавляя больше «комментариев с высоким влиянием».
На брифинге руководитель продукта Codex в OpenAI Александр Эмбирикос заявил, что значительная часть повышения производительности стала возможной благодаря динамическим «способностям к размышлению» GPT-5-Codex. Пользователи могут быть знакомы с маршрутизатором GPT-5 в ChatGPT, который направляет запросы к разным моделям в зависимости от сложности задачи. Эмбирикос пояснил, что GPT-5-Codex работает аналогично, но не имеет внутреннего маршрутизатора и может корректировать продолжительность работы над задачей в реальном времени.
Эмбирикос отмечает, что это преимущество по сравнению с маршрутизатором, который определяет, сколько вычислительной мощности и времени использовать для решения проблемы, в самом начале. Вместо этого GPT-5-Codex может через пять минут после начала работы над проблемой решить, что ему нужно потратить ещё час. Эмбирикос сообщил, что в некоторых случаях наблюдал, как модель работала до семи часов.
0 комментариев