Google представила новую ИИ-модель «nano banana» для генерации и редактирования изображений в Gemini 2.5 Flash
Подразделение Google DeepMind, известное разработкой интерактивных миров, анонсировало новую модель искусственного интеллекта под названием «nano banana» для Gemini 2.5 Flash. Обновление направлено на улучшение генерации и редактирования изображений. Ключевой особенностью стало запоминание ИИ определенных деталей, что упрощает модификацию фотографий (по данным Ars Technica).
Gemini 2.5 Flash упрощает редактирование фотографий
Главной проблемой при редактировании изображений с помощью ИИ была непредсказуемость — пользователи не могли точно знать, какие элементы будут изменены. Google заявляет, что модель «nano banana» работает более точно, изменяя только те элементы, которые указаны пользователем. Это позволяет, например, полностью изменить стиль фотографии, сохранив при этом внешность человека.
Кроме того, Gemini 2.5 Flash способна объединять несколько фотографий в одно изображение. В качестве примера показаны несвязанные снимки женщины и собаки, после чего с помощью запроса ИИ сгенерировал изображение, на котором женщина обнимает собаку на спортивной площадке. Это демонстрирует значительные возможности «nano banana», хотя, вероятно, они будут доступны только в платных версиях модели.
Каждое созданное изображение имеет видимый водяной знак с символом Gemini AI в правом нижнем углу. Как сообщает Ars Technica, система также добавляет невидимый водяной знак SynthID, который остается даже после значительного редактирования изображения. Это затрудняет попытки выдать ИИ-генерацию за собственную работу.
Новая модель уже доступна для тестирования, а вскоре станет доступной разработчикам. Однако некоторые функции ограничены — например, редактирование фотографий с изображением детей в настоящее время заблокировано (Google использует формулировку «currently», что предполагает возможные изменения в будущем).
0 комментариев