OpenAI выпустила GPT Image 1.5: новая модель для генерации изображений в ChatGPT
Компания OpenAI представила новую версию инструмента генерации изображений в ChatGPT. Модель под названием GPT Image 1.5 обещает лучшее следование инструкциям, более точное редактирование и скорость создания картинок до четырех раз выше.
Новая модель стала доступна всем пользователям ChatGPT и через API во вторник, 16 декабря. Это очередной шаг в обострившейся конкуренции с Google Gemini. Напомним, что в ноябре генеральный директор OpenAI Сэм Альтман в утекшем внутреннем меморандуме объявил режим «повышенной готовности» (code red), чтобы вернуть компании лидерство в области ИИ. Амбиции Google подкреплены успехом её флагманской модели Gemini 3 и вирусного генератора изображений Nano Banana Pro, которые возглавили рейтинг LMArena по множеству тестов.
Ответом OpenAI на успехи конкурента стал запуск GPT-5.2 на прошлой неделе, а теперь и ускоренный релиз GPT Image 1.5. Изначально выход нового генератора изображений планировался на начало января. Предыдущая модель, GPT Image 1, была представлена в апреле.
GPT Image 1.5 дебютирует в период, когда генераторы изображений и видео перестают быть прототипами и обретают качества, пригодные для профессионального использования. Как и Nano Banana Pro, новая модель предлагает функции пост-продакшена, предоставляя детальный контроль для сохранения визуальной согласованности — например, сходства лица, освещения, композиции и цветового тона между правками.
«Большинство генеративных ИИ-инструментов для изображений плохо справляются с итерациями, так что это будет огромный шаг вперед», — отмечается в сообщении. Без таких улучшений запрос на конкретное изменение, вроде «скорректируй выражение лица», часто заставляет модель полностью переосмыслить изображение, что нарушает целостность.
Обновление касается не только новых функций. Теперь доступ к генерации изображений в ChatGPT осуществляется через отдельный пункт в боковой панели, который работает «больше как творческая студия», как написала в блоге во вторник генеральный директор по приложениям OpenAI Фижи Симо.
«Новые экраны просмотра и редактирования изображений упрощают создание картинок, соответствующих вашему видению, или поиск вдохновения в трендовых запросах и предустановленных фильтрах», — отметила Симо.
Помимо нового генератора, OpenAI внедряет больше визуальных элементов в интерфейс ChatGPT. Планируется, что поисковые запросы будут отображать больше наглядной информации с четким указанием источников, что может быть полезно, например, для перевода единиц измерения или проверки спортивных результатов.
«Когда вы создаете, вы должны видеть и формировать то, что делаете. Когда визуальный ряд рассказывает историю лучше, чем одни слова, ChatGPT должен его включать. Когда вам нужен быстрый ответ или следующий шаг находится в другом инструменте, он должен быть прямо здесь. Таким образом мы можем продолжать сокращать разрыв между тем, что у вас в голове, и вашей способностью воплотить это в жизнь», — заключила Фижи Симо.








0 комментариев