C

Cosmos Predict2 2B Text2Image

由nvidia開發
Cosmos-Predict2是一系列高性能的預訓練世界基礎模型,專為生成具備物理感知的圖像、視頻和世界狀態而設計,可用於物理AI的開發。
下載量 473
發布時間 : 4/22/2025

模型概述

Cosmos-Predict2能夠根據文本、圖像或視頻輸入,生成動態、高質量的圖像和視頻,是各類世界生成相關應用或研究的基礎。

模型特點

高性能預訓練
經過高度優化的預訓練世界基礎模型,能夠生成具備物理感知的圖像、視頻和世界狀態。
多模態輸入支持
支持文本、圖像或視頻作為輸入,生成動態、高質量的圖像和視頻。
商業可用
該模型可在NVIDIA開放模型許可協議下進行商業使用。

模型能力

文本到圖像生成
視頻到世界狀態預測
物理感知內容生成

使用案例

物理AI開發
動態場景生成
根據文本描述生成具備物理感知的動態場景圖像。
生成高質量、物理合理的場景圖像
未來幀預測
根據文本描述和第一幀圖像預測未來幀。
生成連貫、物理合理的視頻序列
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase