C

Cosmos Predict2 14B Text2Image

nvidiaによって開発
Cosmos-Predict2は、一連の高性能事前学習世界基礎モデルであり、物理AI開発用に物理感知を備えた画像、ビデオ、世界状態を生成するように設計されています。
ダウンロード数 312
リリース時間 : 4/22/2025

モデル概要

拡散ベースの世界基礎モデルで、テキスト、画像、またはビデオ入力に基づいて、動的で高品質な画像とビデオを生成でき、さまざまな世界生成関連のアプリケーションや研究の構築ブロックとして利用できます。

モデル特徴

物理感知生成
物理AI用に設計され、物理感知を備えた画像とビデオを生成し、現実世界の物理的相互作用をシミュレートできます。
高品質出力
動的で高品質な画像とビデオを生成し、デフォルトの解像度は1280x704ピクセルです。
多モーダル入力サポート
テキスト、画像、またはビデオを入力条件としてサポートし、さまざまなアプリケーションシーンに柔軟に対応できます。
商用利用許可
NVIDIAオープンモデルライセンスの下で商用利用が可能で、派生モデルを自由に作成し配布できます。

モデル能力

テキストから画像生成
ビデオ予測
物理シーンシミュレーション
多モーダル理解

使用事例

クリエイティブコンテンツ生成
広告クリエイティブ生成
製品説明に基づいて高品質な広告画像を自動生成します。
物理法則に沿った製品展示画像を生成します
ゲーム開発
ゲームシーン生成
テキスト説明に基づいてゲーム内の物理シーンを生成します。
物理的相互作用能力を持つゲーム環境を生成します
映画前制作
分鏡生成
脚本説明に基づいて映画の分鏡画面を生成します。
動的な効果を持つ分鏡画像を生成します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase