OpenAI представила обновленную версию генератора изображений DALL-E
OpenAI представила обновленную версию своего инструмента преобразования текста в изображение DALL-E, который использует ChatGPT.
Изображение, созданное DALL-E 3. Источник: OpenAI.
Большинство современных инструментов создания изображений на базе искусственного интеллекта сегодня принимают подсказки — описания изображений — и превращают их в произведения искусства в самых разных стилях — от фотореалистичного до фантастического. Но создание правильной подсказки может оказаться настолько сложной задачей, что «текстовая инженерия» становится настоящей профессией.
Новый инструмент OpenAI, DALL-E 3, использует ChatGPT для заполнения подсказок. Через ChatGPT подписчики премиальных планов OpenAI ChatGPT, ChatGPT Plus и ChatGPT Enterprise, могут ввести запрос на изображение и отточить его посредством разговоров с чат-ботом, получая результаты непосредственно в приложении чата.
ChatGPT возьмет подсказку, состоящую всего из нескольких слов, и сделает ее более описательной, предоставляя дополнительные инструкции для модели DALL-E 3.
Интеграция ChatGPT — не единственное нововведение в DALL-E 3. Обновленный инструмент также генерирует изображения более высокого качества, которые более точно отражают подсказки, особенно при работе с более длинными подсказками. Кроме того, DALL-E 3 лучше обрабатывает контент, который исторически был слабым местом генерации изображений, такой как текст и человеческие руки.
Помимо этого, DALL-E 3 использует новые механизмы для уменьшения алгоритмической предвзятости и повышения безопасности — по крайней мере, так утверждает OpenAI. Например, DALL-E 3 отклонит запросы, в которых требуется изображение в стиле ныне живущих художников или общественных деятелей. Кроме того, художники теперь могут отказаться от использования некоторых или всех своих произведений искусства для обучения будущих поколений моделей преобразования текста в изображение OpenAI. (OpenAI вместе с некоторыми своими конкурентами сталкиваются с судебными исками за предположительное использование работ художников, защищенных авторским правом, которые использовались для обучения генеративных моделей изображений ИИ).
Запуск DALL-E 3 происходит на фоне разгорания гонки генеративного искусственного интеллекта, особенно в области синтеза изображений. Конкуренты (такие как Midjourney и Stability AI) продолжают совершенствовать свои модели генерации изображений, заставляя OpenAI идти в ногу со временем.
OpenAI планирует представить DALL-E 3 премиум-пользователям ChatGPT в октябре, а затем исследовательским лабораториям и клиентам API. Компания не сообщила, планирует ли она выпустить бесплатный веб-инструмент, как это было с DALL-E 2 и оригинальной моделью DALL-E.
0 комментариев