🚀 混元3D-2(Hunyuan3D-2)
本项目旨在实现图像到3D和文本到3D的转换,让每个人都能发挥想象力,创建和操作3D资产。
“ 让每个人都能发挥想象力,创建和操作3D资产。”
🚀 快速开始
本仓库包含论文 Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation 中的模型。
Hunyuan3D-2mv 是基于 Hunyuan3D-2 微调而来,支持多视图控制的形状生成。
简单使用示例
from hy3dgen.shapegen import Hunyuan3DDiTFlowMatchingPipeline
pipeline = Hunyuan3DDiTFlowMatchingPipeline.from_pretrained(
'tencent/Hunyuan3D-2mv',
subfolder='hunyuan3d-dit-v2-mv',
use_safetensors=True,
device='cuda'
)
mesh = pipeline(
image={
"front": "your front view image.png",
"left": "your left view image.png",
"back": "your back view image.png"
},
num_inference_steps=30,
octree_resolution=380,
num_chunks=20000,
generator=torch.manual_seed(12345),
output_type='trimesh'
)[0]
有关代码和更多使用细节,请参考 GitHub仓库。
🔗 BibTeX
如果您觉得本仓库有帮助,请引用我们的报告:
@misc{hunyuan3d22025tencent,
title={Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation},
author={Tencent Hunyuan3D Team},
year={2025},
eprint={2501.12202},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
@misc{yang2024tencent,
title={Tencent Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation},
author={Tencent Hunyuan3D Team},
year={2024},
eprint={2411.02293},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
✨ 社区资源
感谢社区成员的贡献,以下是混元3D 2.0的优秀扩展:
🙏 致谢
我们要感谢 DINOv2、Stable Diffusion、FLUX、diffusers 和 HuggingFace 仓库的贡献者,感谢他们的开放研究和探索。
📄 许可证
本项目采用 tencent-hunyuan-community 许可证。