VFusion3D開源3D生成模型 - 利用少量數據實現高效3D生成與重建

首頁

Vfusion3d

由facebook開發

VFusion3D是一個通過少量3D數據與大量合成多視角數據訓練的大型前饋式3D生成模型，是首個研究可擴展3D生成/重建模型的工作。

3D視覺

Transformers

#視頻轉3D生成 #多視角合成 #3D基礎模型

下載量 57

發布時間 : 8/10/2024

模型概述

基於視頻擴散模型的可擴展3D生成模型，用於3D生成和重建任務。

模型特點

可擴展3D生成

通過少量3D數據與大量合成多視角數據訓練，實現可擴展的3D生成

前饋式架構

採用前饋式架構，相比傳統方法更高效

視頻擴散模型基礎

基於視頻擴散模型構建，充分利用時序信息

模型能力

3D模型生成

3D重建

多視角合成

使用案例

3D內容創作

3D資產生成

從單張圖像生成3D模型

可生成高質量3D模型

虛擬現實

VR場景構建

快速生成3D場景元素

加速VR內容開發流程

🚀 [ECCV 2024] VFusion3D：從視頻擴散模型中學習可擴展的3D生成模型

VFusion3D是一個大型前饋3D生成模型，它使用少量3D數據和大量合成多視圖數據進行訓練。該工作首次探索了可擴展的3D生成/重建模型，是邁向3D基礎模型的重要一步。

項目頁面，論文鏈接

VFusion3D：從視頻擴散模型中學習可擴展的3D生成模型
 韓俊霖，菲利普斯·科基諾斯，菲利普·托爾
GenAI，Meta和牛津大學TVG實驗室
歐洲計算機視覺會議 (ECCV)，2024

🚀 快速開始

使用VFusion3D非常簡單！🤗 以下是如何在Hugging Face上使用該模型的步驟：

📦 安裝依賴（可選）

根據你的需求，你可能需要啟用特定功能，如網格生成或視頻渲染。我們提供了以下額外的包來滿足這些需求：

!pip --quiet install imageio[ffmpeg] PyMCubes trimesh rembg[gpu,cli] kiui

💻 直接加載模型

import torch
from transformers import AutoModel, AutoProcessor

# 加載模型和處理器
model = AutoModel.from_pretrained("jadechoghari/vfusion3d", trust_remote_code=True)
processor = AutoProcessor.from_pretrained("jadechoghari/vfusion3d")

# 下載並預處理圖像
import requests
from PIL import Image
from io import BytesIO

image_url = 'https://sm.ign.com/ign_nordic/cover/a/avatar-gen/avatar-generations_prsz.jpg'
response = requests.get(image_url)
image = Image.open(BytesIO(response.content))

# 預處理圖像並獲取源相機信息
image, source_camera = processor(image)

# 生成平面（默認輸出）
output_planes = model(image, source_camera)
print("平面形狀:", output_planes.shape)

# 生成3D網格
output_planes, mesh_path = model(image, source_camera, export_mesh=True)
print("平面形狀:", output_planes.shape)
print("網格保存路徑:", mesh_path)

# 生成視頻
output_planes, video_path = model(image, source_camera, export_video=True)
print("平面形狀:", output_planes.shape)
print("視頻保存路徑:", video_path)

默認（平面）：默認情況下，VFusion3D輸出平面，非常適合進一步的3D操作。
導出網格：如果你需要3D網格，只需將export_mesh設置為True，你將得到一個.obj文件。你還可以通過調整mesh_size參數來自定義網格分辨率。
導出視頻：如果你想要一個3D視頻，將export_video設置為True，你將獲得一個從多個角度渲染的精美視頻。你可以調整render_size和fps來優化視頻效果。

查看我們的演示應用，看看VFusion3D的實際效果！🤗

✨ 主要特性

🔍 最新消息

[2024年8月8日] Hugging Face演示已上線，非常感謝Jade Choghari的幫助。
[2024年7月25日] 發佈VFusion3D的權重和推理代碼。

📊 結果與比較

3D生成結果

3D生成結果1 3D生成結果2

用戶研究結果

🔗 致謝

VFusion3D的推理代碼大量借鑑了OpenLRM。

📖 引用

如果你覺得這項工作有用，請引用我們：

@article{han2024vfusion3d,
  title={VFusion3D: Learning Scalable 3D Generative Models from Video Diffusion Models},
  author={Junlin Han and Filippos Kokkinos and Philip Torr},
  journal={European Conference on Computer Vision (ECCV)},
  year={2024}
}