OpenAI выпустила GPT Image 1.5: новая модель для генерации изображений в ChatGPT

/ ТехнологииНовости / Технологии

Компания OpenAI представила новую версию инструмента генерации изображений в ChatGPT. Модель под названием GPT Image 1.5 обещает лучшее следование инструкциям, более точное редактирование и скорость создания картинок до четырех раз выше.

Новая модель стала доступна всем пользователям ChatGPT и через API во вторник, 16 декабря. Это очередной шаг в обострившейся конкуренции с Google Gemini. Напомним, что в ноябре генеральный директор OpenAI Сэм Альтман в утекшем внутреннем меморандуме объявил режим «повышенной готовности» (code red), чтобы вернуть компании лидерство в области ИИ. Амбиции Google подкреплены успехом её флагманской модели Gemini 3 и вирусного генератора изображений Nano Banana Pro, которые возглавили рейтинг LMArena по множеству тестов.

Ответом OpenAI на успехи конкурента стал запуск GPT-5.2 на прошлой неделе, а теперь и ускоренный релиз GPT Image 1.5. Изначально выход нового генератора изображений планировался на начало января. Предыдущая модель, GPT Image 1, была представлена в апреле.

GPT Image 1.5 дебютирует в период, когда генераторы изображений и видео перестают быть прототипами и обретают качества, пригодные для профессионального использования. Как и Nano Banana Pro, новая модель предлагает функции пост-продакшена, предоставляя детальный контроль для сохранения визуальной согласованности — например, сходства лица, освещения, композиции и цветового тона между правками.

«Большинство генеративных ИИ-инструментов для изображений плохо справляются с итерациями, так что это будет огромный шаг вперед», — отмечается в сообщении. Без таких улучшений запрос на конкретное изменение, вроде «скорректируй выражение лица», часто заставляет модель полностью переосмыслить изображение, что нарушает целостность.

Обновление касается не только новых функций. Теперь доступ к генерации изображений в ChatGPT осуществляется через отдельный пункт в боковой панели, который работает «больше как творческая студия», как написала в блоге во вторник генеральный директор по приложениям OpenAI Фижи Симо.

«Новые экраны просмотра и редактирования изображений упрощают создание картинок, соответствующих вашему видению, или поиск вдохновения в трендовых запросах и предустановленных фильтрах», — отметила Симо.

Помимо нового генератора, OpenAI внедряет больше визуальных элементов в интерфейс ChatGPT. Планируется, что поисковые запросы будут отображать больше наглядной информации с четким указанием источников, что может быть полезно, например, для перевода единиц измерения или проверки спортивных результатов.

«Когда вы создаете, вы должны видеть и формировать то, что делаете. Когда визуальный ряд рассказывает историю лучше, чем одни слова, ChatGPT должен его включать. Когда вам нужен быстрый ответ или следующий шаг находится в другом инструменте, он должен быть прямо здесь. Таким образом мы можем продолжать сокращать разрыв между тем, что у вас в голове, и вашей способностью воплотить это в жизнь», — заключила Фижи Симо.
Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии