Stable Video Diffusion Img2Vid XTオープンソースモデル - 静止画像を簡単にショートビデオクリップに変える

Home

Stable Video Diffusion Img2vid Xt

Developed by model-hub

静止画像を条件フレームとして短い動画クリップを生成する拡散モデル

動画処理 Open Source License:Other #静止画像から動画への変換 #短時間動画生成 #アート創作支援

Downloads 170

Release Time : 12/14/2023

Model Overview

安定ビデオ拡散(SVD)画像変換動画は潜在拡散モデルで、条件画像から25フレーム576x1024解像度の短い動画を生成するように訓練されており、14フレーム版を微調整したものです

Model Features

高解像度動画生成

576x1024解像度の動画生成をサポート

長尺動画生成

25フレーム動画（約4秒）を生成可能で、基本14フレーム版より長い

時間的一貫性デコーダー

時間的一貫性を微調整したf8デコーダーを採用し、動画の連続性を向上

画像条件ベース生成

静止画像を入力条件として動的動画コンテンツを生成

Model Capabilities

静止画像から動画へ変換

短時間動画生成

クリエイティブコンテンツ生成

Use Cases

クリエイティブアート

アート創作

静止アート作品を動的動画表現に変換

芸術的な短い動画クリップを生成

デザイン支援

デザイン作品に動的効果を追加して展示

デザイン作品の動的効果を迅速にプレビュー

研究分野

生成モデル研究

動画生成アルゴリズムの研究と改良に使用

モデル安全性研究

生成モデルの安全な展開方法を研究

🚀 安定ビデオ拡散画像からビデオへのモデルカード

Stable Video Diffusion (SVD) 画像からビデオへの変換は、静止画像を条件付きフレームとして取り込み、そこからビデオを生成する拡散モデルです。

🚀 クイックスタート

モデルの使い方を始めるには、https://github.com/Stability-AI/generative-models をチェックしてください。

✨ 主な機能

Stable Video Diffusion (SVD) 画像からビデオへの変換は、静止画像を条件付きフレームとして取り込み、そこからビデオを生成することができます。

📚 ドキュメント

モデルの詳細

モデルの説明

(SVD) 画像からビデオへの変換は、画像の条件付けから短いビデオクリップを生成するように訓練された潜在拡散モデルです。このモデルは、同じサイズのコンテキストフレームを与えられた場合、解像度 576x1024 で 25 フレームを生成するように訓練されており、SVD 画像からビデオへの変換 [14 フレーム] から微調整されています。また、時間的な一貫性のために、広く使用されている f8-decoder も微調整しています。利便性のために、標準的なフレーム単位のデコーダをこちらで追加で提供しています。

開発者: Stability AI
資金提供元: Stability AI
モデルの種類: 生成型画像からビデオへの変換モデル
微調整元のモデル: SVD 画像からビデオへの変換 [14 フレーム]

モデルのソース

研究目的では、最も人気のある拡散フレームワーク（訓練と推論の両方）を実装した generative-models GitHub リポジトリ (https://github.com/Stability-AI/generative-models) をお勧めします。

リポジトリ: https://github.com/Stability-AI/generative-models
論文: https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets