GPT Image 2 от OpenAI возглавил мировой рейтинг генерации изображений, обогнав Google
OpenAI представила модель GPT Image 2, которая, по данным авторитетного бенчмарка SuperCLUE, заняла первое место в мире среди систем генерации изображений по текстовому описанию. Новинка обошла конкурента от Google — Nano Banana2.
Модель, запущенная 21 апреля, продемонстрировала значительный прогресс в качестве изображений, понимании запросов и детализации. В тестах GPT Image 2 показала выдающиеся результаты по всем ключевым параметрам, включая генерацию иероглифов, реалистичность сцен и общее качество картинки.
Особо отмечается способность модели корректно воспроизводить китайские иероглифы — она набрала 93,07 балла, получив максимальную оценку за точность текста. Будь то каллиграфия на фарфоре или золотые буквы на акриле, символы выглядят естественно и не имеют эффекта «наложения», что решает давнюю проблему западных моделей с иероглифами.
Кроме того, GPT Image 2 отлично справляется со сложными сценами, такими как воссоздание старинных пекарен или традиционного китайского ремесла «Датехуа» (литьё расплавленного металла). Модель также точно интерпретирует длинные текстовые запросы и логические задачи, корректно генерируя научные схемы и дизайн плакатов.
По сравнению с предыдущим поколением, GPT Image 2 совершила качественный скачок в согласованности текста и изображения. Хотя у модели остаются области для улучшения, такие как понимание пространственных отношений и логические рассуждения, в целом она достигла передового уровня в индустрии, ознаменовав новый этап в развитии технологий генерации изображений.











0 комментариев