C

Cosmos Predict2 14B Text2Image

由 nvidia 开发
Cosmos-Predict2是一系列高性能的预训练世界基础模型,专为物理AI开发生成具备物理感知的图像、视频和世界状态而设计。
下载量 312
发布时间 : 4/22/2025

模型简介

基于扩散的世界基础模型,能够根据文本、图像或视频输入,生成动态、高质量的图像和视频,可作为各种世界生成相关应用或研究的构建模块。

模型特点

物理感知生成
专为物理AI设计,生成具备物理感知的图像和视频,能模拟真实世界中的物理交互。
高质量输出
生成动态、高质量的图像和视频,默认分辨率为1280x704像素。
多模态输入支持
支持文本、图像或视频作为输入条件,灵活适应不同应用场景。
商业用途许可
在NVIDIA开放模型许可证下可用于商业用途,并可自由创建和分发衍生模型。

模型能力

文本到图像生成
视频预测
物理场景模拟
多模态理解

使用案例

创意内容生成
广告创意生成
根据产品描述自动生成高质量的广告图像。
生成符合物理规律的产品展示图像
游戏开发
游戏场景生成
根据文本描述生成游戏中的物理场景。
生成具有物理交互能力的游戏环境
影视预制作
分镜生成
根据剧本描述生成影视分镜画面。
生成具有动态效果的分镜图像
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase