C

Cosmos Predict2 2B Text2Image

nvidiaによって開発
Cosmos-Predict2は、物理感知を持つ画像、ビデオ、世界状態を生成するために設計された一連の高性能事前学習世界基礎モデルで、物理AIの開発に使用できます。
ダウンロード数 473
リリース時間 : 4/22/2025

モデル概要

Cosmos-Predict2は、テキスト、画像、またはビデオ入力に基づいて、動的で高品質な画像とビデオを生成でき、さまざまな世界生成関連のアプリケーションや研究の基礎となります。

モデル特徴

高性能事前学習
高度に最適化された事前学習世界基礎モデルで、物理感知を持つ画像、ビデオ、世界状態を生成できます。
多モーダル入力サポート
テキスト、画像、またはビデオを入力としてサポートし、動的で高品質な画像とビデオを生成します。
商用可能
このモデルはNVIDIAオープンモデルライセンス契約の下で商用利用できます。

モデル能力

テキストから画像生成
ビデオから世界状態予測
物理感知コンテンツ生成

使用事例

物理AI開発
動的シーン生成
テキスト記述に基づいて物理感知を持つ動的シーン画像を生成します。
高品質で物理的に合理的なシーン画像を生成
未来フレーム予測
テキスト記述と最初のフレーム画像に基づいて未来のフレームを予測します。
連続的で物理的に合理的なビデオシーケンスを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase