Google DeepMind открывает доступ к Project Genie — генератору игровых миров на ИИ
Google DeepMind открывает доступ к Project Genie — своему экспериментальному инструменту на базе ИИ для создания интерактивных игровых миров по текстовым запросам или изображениям. Начиная с 30 января (по московскому времени) протестировать прототип смогут подписчики Google AI Ultra в США.
Система работает на комбинации последней мировой модели Genie 3, генератора изображений Nano Banana Pro и Gemini. Пользователь создаёт «эскиз мира», описывая окружение и главного персонажа, после чего модель генерирует изображение, которое можно доработать. Затем Project Genie за несколько секунд создаёт из этого изображения мир, по которому можно перемещаться от первого или третьего лица.
Также можно использовать реальные фотографии в качестве основы или «ремикшировать» уже созданные миры. Однако доступное время генерации и навигации ограничено 60 секундами из-за высоких вычислительных затрат.
Как показало тестирование, модель отлично справляется с созданием стилизованных миров (например, в духе аниме, акварели или классических мультфильмов), но испытывает трудности с фотореалистичными или кинематографичными сценами. Кроме того, присутствуют строгие ограничения по безопасности: система блокирует создание контента, связанного с обнажённостью или защищёнными авторским правом персонажами (например, Disney).
В процессе навигации могут возникать ошибки: персонажи иногда проходят сквозь стены, а управление с помощью клавиш W-A-S-D может быть неотзывчивым. Исследователи DeepMind признают, что это ранний прототип, и основная цель — собрать отзывы пользователей для дальнейшего развития технологии мировых моделей, которые считаются ключевым шагом на пути к созданию искусственного общего интеллекта (ИОИ).
Конкуренция в этой области нарастает: свои мировые модели уже представили стартапы World Labs (основатель — Фэй-Фэй Ли) и Runway, а также компания AMI Labs (основатель — Ян Лекун).
«Мы не рассматриваем Project Genie как законченный продукт, но уже сейчас в нём есть проблеск чего-то интересного и уникального, чего нельзя сделать другим способом», — заявил Шломи Фрухтер, руководитель исследований в DeepMind.







0 комментариев