Hunyuan3D-2-test開源3D合成系統 - 免費生成高分辨率帶紋理3D資產

首頁

Hunyuan3d 2 Test

由ImrozeAslam開發

混元3D 2.0是一個先進的大規模3D合成系統，用於生成高分辨率帶紋理的3D資產。

3D視覺支持多種語言開源協議:其他 #高分辨率3D生成 #帶紋理網格合成 #圖像到3D轉換

下載量 151

發布時間 : 5/19/2025

模型概述

混元3D 2.0包含大規模形狀生成模型Hunyuan3D-DiT和大規模紋理合成模型Hunyuan3D-Paint，能夠創建與給定條件圖像精準對齊的幾何體，並生成高分辨率生動紋理貼圖。

模型特點

高分辨率紋理生成

能夠為3D模型生成高分辨率生動的紋理貼圖

精準條件對齊

生成的幾何體能夠與輸入條件圖像精準對齊

兩階段生成流程

先生成基礎網格，再合成紋理貼圖，有效解耦形狀與紋理生成難度

多功能生產平臺

提供混元3D-Studio平臺，支持3D資產編輯和動畫化

模型能力

圖像到3D生成

文本到3D生成

3D網格生成

3D紋理合成

3D資產編輯

使用案例

3D內容創作

遊戲資產生成

快速生成遊戲中的3D角色和道具

高質量帶紋理的3D模型

虛擬場景構建

根據圖像或文本描述生成完整的3D場景

風格一致的3D環境

工業設計

產品原型設計

根據概念圖快速生成3D產品模型

可立即用於評估的設計原型

🚀 混元3D-2（Hunyuan3D-2）

混元3D-2是一個先進的大規模3D合成系統，可用於生成高分辨率的紋理3D資產。它支持圖像到3D和文本到3D的轉換，在相關領域具有出色的性能和應用價值。

“讓每個人都能盡情發揮想象，創造和操控3D資產。”

本倉庫包含論文混元3D 2.0：擴展擴散模型以生成高分辨率紋理3D資產中的模型。有關代碼和更多使用細節，請參考 GitHub倉庫。

🚀 快速開始

你可以按照以下步驟通過代碼或Gradio應用程序使用混元3D 2.0。

📦 安裝指南

請通過官方網站安裝PyTorch，然後通過以下命令安裝其他依賴項：

pip install -r requirements.txt
# 用於紋理
cd hy3dgen/texgen/custom_rasterizer
python3 setup.py install
cd ../../..
cd hy3dgen/texgen/differentiable_renderer
bash compile_mesh_painter.sh OR python3 setup.py install (在Windows上)

💻 使用示例

基礎用法

我們設計了一個類似diffusers的API來使用我們的形狀生成模型 - 混元3D-DiT和紋理合成模型 - 混元3D-Paint。

你可以通過以下方式使用 混元3D-DiT：

from hy3dgen.shapegen import Hunyuan3DDiTFlowMatchingPipeline

pipeline = Hunyuan3DDiTFlowMatchingPipeline.from_pretrained('tencent/Hunyuan3D-2')
mesh = pipeline(image='assets/demo.png')[0]

輸出的網格是一個 trimesh對象，你可以將其保存為glb/obj（或其他格式）文件。

對於 混元3D-Paint，請執行以下操作：

from hy3dgen.texgen import Hunyuan3DPaintPipeline
from hy3dgen.shapegen import Hunyuan3DDiTFlowMatchingPipeline

# 首先生成一個網格
pipeline = Hunyuan3DDiTFlowMatchingPipeline.from_pretrained('tencent/Hunyuan3D-2')
mesh = pipeline(image='assets/demo.png')[0]

pipeline = Hunyuan3DPaintPipeline.from_pretrained('tencent/Hunyuan3D-2')
mesh = pipeline(mesh, image='assets/demo.png')

有關更多高級用法，如 文本到3D 和 為手工製作的網格生成紋理，請訪問 minimal_demo.py。

高級用法

你也可以在自己的計算機上通過以下命令託管一個 Gradio 應用程序：

pip3 install gradio==3.39.0
python3 gradio_app.py

如果你不想自己託管，別忘了訪問混元3D 進行快速使用。

✨ 主要特性

架構

混元3D 2.0採用兩階段生成流程，首先創建一個裸網格，然後為該網格合成紋理映射。這種策略有效地將形狀和紋理生成的難度解耦，並且為生成或手工製作的網格進行紋理處理提供了靈活性。

性能

我們已經將混元3D 2.0與其他開源和閉源的3D生成方法進行了評估。數值結果表明，混元3D 2.0在生成的紋理3D資產質量和條件跟隨能力方面超過了所有基線模型。

模型	CMMD(↓)	FID_CLIP(↓)	FID(↓)	CLIP分數(↑)
頂級開源模型1	3.591	54.639	289.287	0.787
頂級閉源模型1	3.600	55.866	305.922	0.779
頂級閉源模型2	3.368	49.744	294.628	0.806
頂級閉源模型3	3.218	51.574	295.691	0.799
混元3D 2.0	3.193	49.165	282.429	0.809

混元3D 2.0的生成結果：

預訓練模型

模型	日期	Huggingface
混元3D-DiT-v2-0	2025-01-21	下載
混元3D-Paint-v2-0	2025-01-21	下載
混元3D-Delight-v2-0	2025-01-21	下載

📚 詳細文檔

開源計劃

[x] 推理代碼
[x] 模型檢查點
[x] 技術報告
[ ] ComfyUI
[ ] TensorRT版本

BibTeX引用

如果你發現本倉庫有幫助，請引用我們的報告：

@misc{hunyuan3d22025tencent,
    title={Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation},
    author={Tencent Hunyuan3D Team},
    year={2025},
    eprint={2501.12202},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}

@misc{yang2024tencent,
    title={Tencent Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation},
    author={Tencent Hunyuan3D Team},
    year={2024},
    eprint={2411.02293},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}