H

Hunyuanvideo I2V

tencentによって開発
混元ビデオ - I2Vは、全く新しい画像から動画への生成フレームワークで、騰訊の混元ビデオモデルを拡張したもので、静止画像から高品質の動画コンテンツを生成することができます。
ダウンロード数 3,272
リリース時間 : 3/5/2025

モデル概要

混元ビデオ - I2Vは、混元ビデオモデルに基づく画像から動画への生成フレームワークで、トークン置換技術を通じて参照画像の情報を動画生成プロセスに組み込み、マルチモーダル大規模言語モデルを利用して入力画像の意味内容の理解能力を強化します。

モデル特徴

画像の意味理解
事前学習されたマルチモーダル大規模言語モデルをテキストエンコーダーとして採用し、入力画像の意味内容の理解能力を強化します。
クロスモーダルアテンション
画像トークンと動画の潜在トークンを結合した後、クロスモーダルの全アテンション計算をサポートします。
高解像度生成
最高720P解像度、最大129フレーム(5秒)の動画生成をサポートします。
LoRAエフェクトサポート
LoRAエフェクトトレーニングコードを提供し、より面白い動画エフェクトを作成するために使用できます。

モデル能力

静止画像から動画への変換
高解像度動画生成
マルチモーダルコンテンツ理解
動画エフェクトのカスタマイズ

使用事例

コンテンツ作成
ショートムービー生成
単一の画像からショートムービーコンテンツを生成します。
5秒の720P解像度の動画を生成します。
エフェクト制作
LoRAエフェクト動画
LoRAトレーニングを通じて動画エフェクトをカスタマイズします。
特定のスタイルまたはエフェクトの変換を実現します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase