Gemini Nano Banana: новый ИИ-редактор изображений от Google умеет создавать дипфейки, но не может обрезать фото

28 августа 2025, 19:47 / Технологии → Новости / Технологии

Готовы к очередному мрачному применению генеративного ИИ? Я не уверен, что готов, но Google представил обновление под названием «Nano Banana» для своего ИИ Gemini. Если точнее, это крупное обновление возможностей генерации изображений в Gemini, также известное как Gemini 2.5 Flash.

Еще в апреле Google добавила в приложение Gemini функцию нативного редактирования изображений. Nano Banana улучшает эту модель, позволяя приложению генерировать визуальные вариации персонажа или объекта с пугающей последовательностью. Хотя лично я бы не советовал загружать свое изображение в любую модель генеративного ИИ, Google демонстрирует, как приложение Gemini теперь может показать, как вы бы выглядели в роли матадора, персонажа ситкома 90-х или даже художника.

«Gemini позволяет комбинировать фотографии, чтобы поместить себя в изображение с вашим питомцем, изменить фон комнаты для предварительного просмотра новых обоев или поместить себя в любое место мира, которое вы можете представить, — и все это сохраняя вас, вас», — пишет Google.

В блоге также отмечается, что это обновление в настоящее время возглавляет рейтинг моделей редактирования изображений LMArena. Помимо объединения объектов из нескольких фотографий, смены костюмов и декораций, приложение Gemini теперь предлагает многоэтапное редактирование. Сделайте снимок пустой комнаты и поручите Gemini заполнить ее, не перемещаясь в совершенно другое место в процессе нескольких текстовых запросов. Именно возможность делать эти небольшие, постепенные правки без заметных несоответствий привлекает внимание.

Это умно, конечно, но я до сих пор не смог заставить его эффективно обрезать квадратное изображение до соотношения 16:9, а это основы редактирования. Gemini просто сообщил мне, что он «не способен выполнять точные правки, такие как обрезка изображения до определенного соотношения сторон».

Конечно, вы все еще можете использовать приложение Gemini для создания забавных селфи или заняться дизайном интерьера, но вы также можете использовать его для манипуляций с изображениями умерших знаменитостей, создавая полностью антиисторические изображения. Раньше я думал, что неплохо определяю «отлив» ИИ-генерации, но пройдя тест Microsoft «Реально или нет» в прошлом месяце и увидев это, я понял, что сильно переоценил свои способности.

Справедливости ради, все изображения, сгенерированные с помощью приложения Gemini, имеют видимый водяной знак, указывающий на то, что они созданы ИИ, но он достаточно незаметен, чтобы его можно было пропустить или чтобы недобросовестные пользователи просто обрезали его в другом программном обеспечении для редактирования изображений. Google пишет, что все изображения также имеют «невидимый цифровой водяной знак SynthID», который должен обнаруживаться собственным детектором SynthID компании. Однако он пока не получил широкого распространения, поскольку программа все еще ищет партнеров и ранних тестировщиков.

Откровенно говоря, Nano Banana и подход больших технологических компаний «двигаться быстро и ломать вещи» в отношении генеративного ИИ заставляет меня больше никогда не выкладывать свое лицо в интернет.

Gemini Nano Banana: новый ИИ-редактор изображений от Google умеет создавать дипфейки, но не может обрезать фото

0 комментариев

Оставить комментарий

Все комментарии - Технологии