C

Cosmos Predict2 14B Video2World

由nvidia開發
Cosmos-Predict2 是一系列高性能的預訓練世界基礎模型,專為生成具備物理感知的圖像、視頻和世界狀態而設計,可用於物理人工智能的開發。
下載量 232
發布時間 : 4/25/2025

模型概述

基於擴散模型的世界基礎模型,能夠根據文本、圖像或視頻輸入,生成動態、高質量的圖像和視頻,是各種世界生成相關應用或研究的基石。

模型特點

高性能預訓練
經過精心預訓練的世界基礎模型,能夠生成物理感知的圖像、視頻和世界狀態。
多模態輸入支持
支持文本 + 圖像、文本 + 視頻等多種輸入類型,為世界生成提供更多可能性。
商業可用
在NVIDIA開放模型許可協議下,可用於商業用途。
全球部署
支持全球範圍內的部署。

模型能力

文本到圖像生成
視頻到世界狀態預測
多模態輸入處理
高質量視頻生成

使用案例

物理人工智能
動態場景生成
根據文本描述生成動態、高質量的圖像和視頻,模擬物理世界中的場景。
生成的視頻能夠捕捉關鍵元素,並在指定的時間限制內完成動畫場景。
世界狀態預測
根據輸入的第一幀圖像和文本描述,預測未來的世界狀態。
生成的視頻幀能夠模擬物理定律和交互。
創意內容生成
動畫製作
利用文本和圖像輸入生成動畫片段。
生成5秒的動畫剪輯,分辨率為1280x704像素,幀率為16幀/秒。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase