Stable Video Diffusionオープンソース画像から動画への変換モデル - 無料で静止画像を短い動画クリップに変える

ホーム

Stable Video Diffusion Img2vid

model-hubによって開発

Stable Video Diffusion（SVD）は、静止画像を入力条件として短い動画クリップを生成できる拡散モデルです。

動画処理オープンソースライセンス:その他 #静止画像から動画への変換 #14フレーム動画生成 #アート創作支援

ダウンロード数 116

リリース時間 : 12/14/2023

モデル概要

このモデルは潜在拡散モデルで、画像条件から短い動画クリップ（14フレーム）を生成するように訓練されています。時間的一貫性を確保するために微調整されたf8デコーダーを含みます。

モデル特徴

画像条件生成

静止画像を入力条件として一貫性のある動画クリップを生成

時間的一貫性デコーダー

微調整されたf8デコーダーを使用して生成動画の時間的一貫性を確保

高品質出力

ユーザー調査で競合モデルよりも優れた動画生成品質を示しました

モデル能力

静止画像から短い動画を生成

動画フレーム間の一貫性を維持

576x1024解像度の動画生成

使用事例

研究用途

生成モデル研究

動画生成モデルの技術的限界を探るために使用

モデル安全性研究

有害なコンテンツを生成する可能性のあるモデルの安全な展開方法を研究

クリエイティブアプリケーション

アート創作

アーティストやデザイナー向けのクリエイティブツールを提供

教育ツール

教育やクリエイティブツールの開発

🚀 安定ビデオ拡散画像からビデオへのモデルカード

Stable Video Diffusion (SVD) の画像からビデオへの変換モデルは、静止画像を条件付きフレームとして取り込み、そこからビデオを生成する拡散モデルです。これにより、画像を基にしたビデオの生成が可能になります。

🚀 クイックスタート

モデルの使い始め方については、https://github.com/Stability-AI/generative-models をご確認ください。

✨ 主な機能

静止画像を条件付きフレームとして、ビデオを生成することができます。
576x1024の解像度で14フレームの短いビデオクリップを生成するように学習されています。
時間的な一貫性のために、広く使用されている f8-decoder を微調整しています。

📚 ドキュメント

モデルの詳細

モデルの説明

(SVD) 画像からビデオへの変換モデルは、画像を条件付けとして短いビデオクリップを生成するように学習された潜在拡散モデルです。このモデルは、同じサイズのコンテキストフレームを与えられた場合、576x1024の解像度で14フレームを生成するように学習されています。また、時間的な一貫性のために、広く使用されている f8-decoder を微調整しています。利便性のために、標準的なフレーム単位のデコーダをこちらで追加で提供しています。

属性	详情
開発者	Stability AI
資金提供元	Stability AI
モデルタイプ	生成型画像からビデオへのモデル

モデルのソース

研究目的では、最も人気のある拡散フレームワーク（学習と推論の両方）を実装した generative-models GitHubリポジトリ (https://github.com/Stability-AI/generative-models) をお勧めします。

リポジトリ: https://github.com/Stability-AI/generative-models
論文: https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets