Google добавила в Gemini функцию преобразования фото в короткие видео
Google, принадлежащая Alphabet Inc., расширила функционал своего искусственного интеллекта Gemini, добавив возможность превращать фотографии в короткие видеоролики. Эта функция, ранее доступная ограниченному кругу пользователей, теперь будет открыта для подписчиков планов Gemini Ultra и Pro в отдельных регионах.
С сегодняшнего дня пользователи смогут создавать 8-секундные клипы со звуком на основе фотографий через веб-версию Gemini. Для этого достаточно загрузить изображение и добавить текстовое описание сцены. Видео генерируются в формате MP4 с разрешением 720p и соотношением сторон 16:9.
«Мы предприняли значительные шаги, чтобы обеспечить безопасное и соответствующее использование технологии генерации видео», — заявили в Google.
Новая функция работает на основе модели Veo 3, представленной в мае на ежегодной конференции разработчиков Google. Однако тесты Bloomberg News выявили некоторые недостатки: ИИ иногда изменял черты лица людей на фото, а в отдельных случаях даже расовую принадлежность. Также система пока не справляется со сложными запросами, например, не может заставить человека на фото исполнять брейк-данс, ограничиваясь простыми действиями вроде махания рукой.
В Google отметили, что технология анимации лиц ещё находится в стадии разработки и лучше справляется с оживлением пейзажей, рисунков и повседневных объектов. Компания планирует продолжать совершенствовать модель в будущих обновлениях.
Это обновление позволяет Google конкурировать с такими игроками рынка ИИ, как OpenAI, Runway AI, а также китайскими компаниями Alibaba, Manus и Kuaishou Technology, которые также активно развивают технологии генерации видео.
0 комментариев