C

Cosmos Predict2 2B Text2Image

由 nvidia 开发
Cosmos-Predict2是一系列高性能的预训练世界基础模型,专为生成具备物理感知的图像、视频和世界状态而设计,可用于物理AI的开发。
下载量 473
发布时间 : 4/22/2025

模型简介

Cosmos-Predict2能够根据文本、图像或视频输入,生成动态、高质量的图像和视频,是各类世界生成相关应用或研究的基础。

模型特点

高性能预训练
经过高度优化的预训练世界基础模型,能够生成具备物理感知的图像、视频和世界状态。
多模态输入支持
支持文本、图像或视频作为输入,生成动态、高质量的图像和视频。
商业可用
该模型可在NVIDIA开放模型许可协议下进行商业使用。

模型能力

文本到图像生成
视频到世界状态预测
物理感知内容生成

使用案例

物理AI开发
动态场景生成
根据文本描述生成具备物理感知的动态场景图像。
生成高质量、物理合理的场景图像
未来帧预测
根据文本描述和第一帧图像预测未来帧。
生成连贯、物理合理的视频序列
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase