L

Ldm3d 4c

由Intel開發
LDM3D是一個能從文本提示生成圖像和深度圖數據的潛在擴散模型,支持3D內容創作
下載量 1,086
發布時間 : 6/22/2023

模型概述

基於潛在擴散框架的3D生成模型,可同時輸出RGB圖像和深度圖,應用於數字內容創作領域

模型特點

雙模態輸出
同時生成RGB圖像和對應深度圖,支持3D內容構建
高質量生成
在FID(27.82)和CLIP(26.61)等指標上表現優異
深度感知
深度圖生成絕對相對誤差僅0.0911,精度較高

模型能力

文本到圖像生成
深度圖預測
3D場景構建
多模態輸出

使用案例

數字娛樂
遊戲場景生成
根據文本描述自動生成遊戲場景的RGB和深度信息
可快速構建3D遊戲素材
建築設計
建築可視化
通過文本描述生成建築效果圖及深度信息
支持360度視圖應用開發
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase