C

Cosmos Predict2 14B Text2Image

由nvidia開發
Cosmos-Predict2是一系列高性能的預訓練世界基礎模型,專為物理AI開發生成具備物理感知的圖像、視頻和世界狀態而設計。
下載量 312
發布時間 : 4/22/2025

模型概述

基於擴散的世界基礎模型,能夠根據文本、圖像或視頻輸入,生成動態、高質量的圖像和視頻,可作為各種世界生成相關應用或研究的構建模塊。

模型特點

物理感知生成
專為物理AI設計,生成具備物理感知的圖像和視頻,能模擬真實世界中的物理交互。
高質量輸出
生成動態、高質量的圖像和視頻,默認分辨率為1280x704像素。
多模態輸入支持
支持文本、圖像或視頻作為輸入條件,靈活適應不同應用場景。
商業用途許可
在NVIDIA開放模型許可證下可用於商業用途,並可自由創建和分發衍生模型。

模型能力

文本到圖像生成
視頻預測
物理場景模擬
多模態理解

使用案例

創意內容生成
廣告創意生成
根據產品描述自動生成高質量的廣告圖像。
生成符合物理規律的產品展示圖像
遊戲開發
遊戲場景生成
根據文本描述生成遊戲中的物理場景。
生成具有物理交互能力的遊戲環境
影視預製作
分鏡生成
根據劇本描述生成影視分鏡畫面。
生成具有動態效果的分鏡圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase