C

Cosmos Predict2 14B Video2World

nvidiaによって開発
Cosmos-Predict2は、物理感知を持った画像、ビデオ、世界状態を生成するために設計された一連の高性能事前学習世界基礎モデルで、物理人工知能の開発に使用できます。
ダウンロード数 232
リリース時間 : 4/25/2025

モデル概要

拡散モデルに基づく世界基礎モデルで、テキスト、画像、またはビデオ入力に基づいて、動的で高品質な画像とビデオを生成でき、さまざまな世界生成関連のアプリケーションや研究の基盤となります。

モデル特徴

高性能事前学習
精心に事前学習された世界基礎モデルで、物理感知を持った画像、ビデオ、世界状態を生成できます。
マルチモーダル入力対応
テキスト + 画像、テキスト + ビデオなどのさまざまな入力タイプをサポートし、世界生成により多くの可能性を提供します。
商用利用可能
NVIDIAオープンモデルライセンス契約の下で、商用目的に使用できます。
グローバル展開
世界中での展開をサポートします。

モデル能力

テキストから画像生成
ビデオから世界状態予測
マルチモーダル入力処理
高品質ビデオ生成

使用事例

物理人工知能
動的シーン生成
テキスト記述に基づいて、動的で高品質な画像とビデオを生成し、物理世界のシーンをシミュレートします。
生成されたビデオは重要な要素を捉え、指定された時間制限内でアニメーションシーンを完成させることができます。
世界状態予測
入力された最初のフレーム画像とテキスト記述に基づいて、未来の世界状態を予測します。
生成されたビデオフレームは物理法則と相互作用をシミュレートできます。
クリエイティブコンテンツ生成
アニメーション制作
テキストと画像入力を利用してアニメーションクリップを生成します。
解像度1280x704ピクセル、フレームレート16フレーム/秒の5秒のアニメーションクリップを生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase