Google представила Gemini Omni: ИИ, создающий видео из текста, изображений и аудио
Компания Google на конференции Google I/O представила Gemini Omni — новое семейство мультимодальных моделей ИИ, способных создавать видеоконтент на основе комбинации изображений, аудио, текста и видео. Как заявил генеральный директор Google Сундар Пичаи, модель может «создать что угодно из любого ввода».
В отличие от простого склеивания входных данных, Omni анализирует все модальности вместе, чтобы создать согласованный результат — высококачественные видео, демонстрирующие понимание физики, культуры, истории и науки. Модель также позволяет редактировать фотографии с помощью текстовых команд, подобно инструменту Google Nano Banana.
Руководитель отдела управления продуктами Google DeepMind Николь Брихтова подчеркнула, что это не просто обновление существующей видеомодели Veo, а «следующий шаг к объединению интеллекта Gemini с возможностями рендеринга наших медиамоделей». В качестве примера главный технолог DeepMind Корай Кавукчуоглу привел создание видео по запросу «глиняный мультфильм, объясняющий сворачивание белка» — модель быстро сгенерировала ролик с закадровым голосом, описывающим процесс.
Первая модель в семействе — Gemini Omni Flash — будет доступна сегодня в приложении Gemini, YouTube Shorts и креативной студии Flow. Она способна создавать 10-секундные видео. В будущем планируется увеличить длительность. Для предотвращения дипфейков пользователям, желающим создавать видео с цифровыми аватарами, необходимо будет пройти процедуру верификации, включающую запись себя и произнесение последовательности цифр. Все созданные видео будут содержать цифровой водяной знак SynthID.
Хотя Omni Flash позиционируется как потребительский инструмент для создания «персонализированных мемов», его возможности очевидны и для корпоративных и творческих задач. Google планирует выпустить модель через API в ближайшие недели. Более профессиональная версия Omni Pro, которая будет работать лучше во всех задачах, выйдет позже, когда, по словам Брихтовой, компания будет готова к «качественному скачку по сравнению с Flash».







0 комментариев