Tencent представила Hunyuan3D World Model 1.0 — первую в индустрии open-source модель для генерации 3D-миров
Компания Tencent анонсировала релиз Hunyuan3D World Model 1.0 — первой в отрасли открытой модели искусственного интеллекта, способной создавать интерактивные 3D-миры на основе текстового описания или одного изображения.
Ключевые возможности
- Генерация иммерсивных миров: Модель создаёт панорамные 360°-сцены, подходящие для VR и других интерактивных сред.
- Экспорт 3D-мешей: Результаты можно выгружать в форматах, совместимых с Unity, Unreal Engine и другими движками.
- Интерактивные объекты: Модель автоматически разделяет передний и задний план, позволяя изменять положение, масштаб и вращение объектов.
Как это работает?
1. Генерация панорамы: Diffusion Transformer (Panorama-DiT) создаёт детализированное 360°-изображение без швов и искажений.
2. Семантическая сегментация: Vision-Language Model (VLM) разделяет сцену на слои (небо, фон, объекты).
3. 3D-реконструкция: Каждый слой преобразуется в 3D с картой глубины, а объекты — в отдельные ассеты.
4. Расширение мира: Видеодиффузионная модель Voyager позволяет "достраивать" окружение за пределы начального вида.
Сферы применения
Технология открывает новые возможности для:
- разработки игр,
- создания VR-сред,
- цифрового производства контента.
Страница проекта:https://3d-models.hunyuan.tencent.com/world/
Демо:https://3d.hunyuan.tencent.com/sceneTo3D
Github:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0
Hugging Face:https://huggingface.co/tencent/HunyuanWorld-1
0 комментариев