C

Cosmos Predict2 14B Text2Image

Developed by nvidia
Cosmos-Predict2是一系列高性能的預訓練世界基礎模型,專為物理AI開發生成具備物理感知的圖像、視頻和世界狀態而設計。
Downloads 312
Release Time : 4/22/2025

Model Overview

基於擴散的世界基礎模型,能夠根據文本、圖像或視頻輸入,生成動態、高質量的圖像和視頻,可作為各種世界生成相關應用或研究的構建模塊。

Model Features

物理感知生成
專為物理AI設計,生成具備物理感知的圖像和視頻,能模擬真實世界中的物理交互。
高質量輸出
生成動態、高質量的圖像和視頻,默認分辨率為1280x704像素。
多模態輸入支持
支持文本、圖像或視頻作為輸入條件,靈活適應不同應用場景。
商業用途許可
在NVIDIA開放模型許可證下可用於商業用途,並可自由創建和分發衍生模型。

Model Capabilities

文本到圖像生成
視頻預測
物理場景模擬
多模態理解

Use Cases

創意內容生成
廣告創意生成
根據產品描述自動生成高質量的廣告圖像。
生成符合物理規律的產品展示圖像
遊戲開發
遊戲場景生成
根據文本描述生成遊戲中的物理場景。
生成具有物理交互能力的遊戲環境
影視預製作
分鏡生成
根據劇本描述生成影視分鏡畫面。
生成具有動態效果的分鏡圖像
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase