Stable Video Diffusion Img2Vid XTオープンソースモデル - 静止画像を簡単にショートビデオクリップに変える

ホーム

Stable Video Diffusion Img2vid Xt

model-hubによって開発

静止画像を条件フレームとして短い動画クリップを生成する拡散モデル

動画処理オープンソースライセンス:その他 #静止画像から動画への変換 #短時間動画生成 #アート創作支援

ダウンロード数 170

リリース時間 : 12/14/2023

モデル概要

安定ビデオ拡散(SVD)画像変換動画は潜在拡散モデルで、条件画像から25フレーム576x1024解像度の短い動画を生成するように訓練されており、14フレーム版を微調整したものです

モデル特徴

高解像度動画生成

576x1024解像度の動画生成をサポート

長尺動画生成

25フレーム動画（約4秒）を生成可能で、基本14フレーム版より長い

時間的一貫性デコーダー

時間的一貫性を微調整したf8デコーダーを採用し、動画の連続性を向上

画像条件ベース生成

静止画像を入力条件として動的動画コンテンツを生成

モデル能力

静止画像から動画へ変換

短時間動画生成

クリエイティブコンテンツ生成

使用事例

クリエイティブアート

アート創作

静止アート作品を動的動画表現に変換

芸術的な短い動画クリップを生成

デザイン支援

デザイン作品に動的効果を追加して展示

デザイン作品の動的効果を迅速にプレビュー

研究分野

生成モデル研究

動画生成アルゴリズムの研究と改良に使用

モデル安全性研究

生成モデルの安全な展開方法を研究

🚀 安定ビデオ拡散画像からビデオへのモデルカード

Stable Video Diffusion (SVD) 画像からビデオへの変換は、静止画像を条件付きフレームとして取り込み、そこからビデオを生成する拡散モデルです。

🚀 クイックスタート

モデルの使い方を始めるには、https://github.com/Stability-AI/generative-models をチェックしてください。

✨ 主な機能

Stable Video Diffusion (SVD) 画像からビデオへの変換は、静止画像を条件付きフレームとして取り込み、そこからビデオを生成することができます。

📚 ドキュメント

モデルの詳細

モデルの説明

(SVD) 画像からビデオへの変換は、画像の条件付けから短いビデオクリップを生成するように訓練された潜在拡散モデルです。このモデルは、同じサイズのコンテキストフレームを与えられた場合、解像度 576x1024 で 25 フレームを生成するように訓練されており、SVD 画像からビデオへの変換 [14 フレーム] から微調整されています。また、時間的な一貫性のために、広く使用されている f8-decoder も微調整しています。利便性のために、標準的なフレーム単位のデコーダをこちらで追加で提供しています。

開発者: Stability AI
資金提供元: Stability AI
モデルの種類: 生成型画像からビデオへの変換モデル
微調整元のモデル: SVD 画像からビデオへの変換 [14 フレーム]

モデルのソース

研究目的では、最も人気のある拡散フレームワーク（訓練と推論の両方）を実装した generative-models GitHub リポジトリ (https://github.com/Stability-AI/generative-models) をお勧めします。

リポジトリ: https://github.com/Stability-AI/generative-models
論文: https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets