🚀 混元3D-2(Hunyuan3D-2)
混元3D-2是一個先進的大規模3D合成系統,可用於生成高分辨率的紋理3D資產。它支持圖像到3D和文本到3D的轉換,在相關領域具有出色的性能和應用價值。
“讓每個人都能盡情發揮想象,創造和操控3D資產。”
本倉庫包含論文 混元3D 2.0:擴展擴散模型以生成高分辨率紋理3D資產 中的模型。有關代碼和更多使用細節,請參考 GitHub倉庫。
🚀 快速開始
你可以按照以下步驟通過代碼或Gradio應用程序使用混元3D 2.0。
📦 安裝指南
請通過 官方網站 安裝PyTorch,然後通過以下命令安裝其他依賴項:
pip install -r requirements.txt
cd hy3dgen/texgen/custom_rasterizer
python3 setup.py install
cd ../../..
cd hy3dgen/texgen/differentiable_renderer
bash compile_mesh_painter.sh OR python3 setup.py install (在Windows上)
💻 使用示例
基礎用法
我們設計了一個類似diffusers的API來使用我們的形狀生成模型 - 混元3D-DiT和紋理合成模型 - 混元3D-Paint。
你可以通過以下方式使用 混元3D-DiT:
from hy3dgen.shapegen import Hunyuan3DDiTFlowMatchingPipeline
pipeline = Hunyuan3DDiTFlowMatchingPipeline.from_pretrained('tencent/Hunyuan3D-2')
mesh = pipeline(image='assets/demo.png')[0]
輸出的網格是一個 trimesh對象,你可以將其保存為glb/obj(或其他格式)文件。
對於 混元3D-Paint,請執行以下操作:
from hy3dgen.texgen import Hunyuan3DPaintPipeline
from hy3dgen.shapegen import Hunyuan3DDiTFlowMatchingPipeline
pipeline = Hunyuan3DDiTFlowMatchingPipeline.from_pretrained('tencent/Hunyuan3D-2')
mesh = pipeline(image='assets/demo.png')[0]
pipeline = Hunyuan3DPaintPipeline.from_pretrained('tencent/Hunyuan3D-2')
mesh = pipeline(mesh, image='assets/demo.png')
有關更多高級用法,如 文本到3D 和 為手工製作的網格生成紋理,請訪問 minimal_demo.py。
高級用法
你也可以在自己的計算機上通過以下命令託管一個 Gradio 應用程序:
pip3 install gradio==3.39.0
python3 gradio_app.py
如果你不想自己託管,別忘了訪問 混元3D 進行快速使用。
✨ 主要特性
架構
混元3D 2.0採用兩階段生成流程,首先創建一個裸網格,然後為該網格合成紋理映射。這種策略有效地將形狀和紋理生成的難度解耦,並且為生成或手工製作的網格進行紋理處理提供了靈活性。
性能
我們已經將混元3D 2.0與其他開源和閉源的3D生成方法進行了評估。數值結果表明,混元3D 2.0在生成的紋理3D資產質量和條件跟隨能力方面超過了所有基線模型。
模型 |
CMMD(↓) |
FID_CLIP(↓) |
FID(↓) |
CLIP分數(↑) |
頂級開源模型1 |
3.591 |
54.639 |
289.287 |
0.787 |
頂級閉源模型1 |
3.600 |
55.866 |
305.922 |
0.779 |
頂級閉源模型2 |
3.368 |
49.744 |
294.628 |
0.806 |
頂級閉源模型3 |
3.218 |
51.574 |
295.691 |
0.799 |
混元3D 2.0 |
3.193 |
49.165 |
282.429 |
0.809 |
混元3D 2.0的生成結果:
預訓練模型
模型 |
日期 |
Huggingface |
混元3D-DiT-v2-0 |
2025-01-21 |
下載 |
混元3D-Paint-v2-0 |
2025-01-21 |
下載 |
混元3D-Delight-v2-0 |
2025-01-21 |
下載 |
📚 詳細文檔
開源計劃
- [x] 推理代碼
- [x] 模型檢查點
- [x] 技術報告
- [ ] ComfyUI
- [ ] TensorRT版本
BibTeX引用
如果你發現本倉庫有幫助,請引用我們的報告:
@misc{hunyuan3d22025tencent,
title={Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation},
author={Tencent Hunyuan3D Team},
year={2025},
eprint={2501.12202},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
@misc{yang2024tencent,
title={Tencent Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation},
author={Tencent Hunyuan3D Team},
year={2024},
eprint={2411.02293},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
社區資源
感謝社區成員的貢獻,這裡有混元3D 2.0的一些優秀擴展:
致謝
我們要感謝 DINOv2、Stable Diffusion、FLUX、diffusers 和 HuggingFace 倉庫的貢獻者,感謝他們的開放研究和探索。
Star歷史
📄 許可證
本項目採用 騰訊混元社區許可證。