Nvcomposer
NVComposer是一種無需顯式外部對齊的生成式多視角新視角合成模型,通過圖像-姿態雙流擴散和幾何感知特徵對齊實現高質量3D視圖生成。
下載量 93
發布時間 : 12/6/2024
模型概述
該模型通過同步生成目標新視角與條件相機姿態,結合幾何感知特徵對齊模塊,顯著提升了多視角新視角合成的質量和靈活性。
模型特點
無外部對齊依賴
通過雙流擴散模型同步生成圖像和相機姿態,無需顯式姿態估計或預重建流程
幾何感知特徵對齊
利用預訓練稠密立體模型提取幾何先驗,增強特徵對齊效果
多視角兼容性
在視角間重疊不足或存在遮擋情況下仍能保持穩定性能
模型能力
單圖像3D視圖生成
多視角圖像合成
相機姿態估計
幾何特徵提取
使用案例
3D內容創作
虛擬場景構建
從單張或多張圖片生成完整3D場景
可生成高質量的多視角一致3D視圖
增強現實應用
為AR應用快速生成3D對象視圖
即時生成新視角的能力適合AR場景需求
影視特效
視角擴展
基於有限拍攝素材生成額外視角
可減少實際拍攝工作量同時保持視覺一致性
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98