stable-video-diffusion-img2vid-xtオープンソースモデル - 画像を使って576x1024解像度、25フレームの短編動画を無料で生成

ホーム

Stable Video Diffusion Img2vid Xt

thingthatisによって開発

静止画像から短い動画クリップを生成する拡散モデルで、576x1024解像度25フレームの動画生成をサポート

動画処理オープンソースライセンス:その他 #静止画から動画への変換 #高フレームレート生成 #アート創作支援

ダウンロード数 17

リリース時間 : 12/8/2023

モデル概要

このモデルは潜在拡散モデルで、静止画像を条件フレームとして入力し、短い動画クリップを生成します。SVD画像変換[14フレーム]を微調整し、時間的一貫性と解像度サポートを向上させました。

モデル特徴

高解像度サポート

576x1024解像度の動画生成をサポート

長尺動画生成

25フレームの動画クリップ（約4秒）を生成可能

時間的一貫性最適化

f8デコーダを微調整し、生成動画の時間的一貫性を向上

モデル能力

静止画像から動画生成

高解像度動画生成

時間的一貫性の維持

使用事例

アート創作

コンセプトアートのアニメーション化

静止コンセプトアートを動的展示に変換

4秒程度の動的展示動画を生成

研究

生成モデル研究

画像から動画への生成技術を研究

コンテンツセキュリティ研究

有害コンテンツが生成される可能性のあるモデルの安全な展開を研究

🚀 安定ビデオ拡散画像からビデオへのモデルカード

Stable Video Diffusion (SVD) 画像からビデオへの変換モデルは、静止画像を条件付きフレームとして取り込み、そこからビデオを生成する拡散モデルです。

🚀 クイックスタート

モデルの使い始め方については、https://github.com/Stability-AI/generative-models をご覧ください。

✨ 主な機能

Stable Video Diffusion (SVD) 画像からビデオへの変換モデルは、静止画像を入力として受け取り、それを元にビデオを生成します。このモデルは、潜在拡散モデルをベースに構築されており、画像を条件付けとして短いビデオクリップを生成するように訓練されています。

📚 ドキュメント

モデルの詳細

モデルの説明

(SVD) 画像からビデオへの変換モデルは、画像を条件付けとして短いビデオクリップを生成するように訓練された潜在拡散モデルです。このモデルは、同じサイズのコンテキストフレームを与えられた場合、解像度 576x1024 で 25 フレームのビデオを生成するように訓練されており、SVD Image-to-Video [14 frames] から微調整されています。また、時間的な一貫性のために、広く使用されている f8-decoder も微調整しています。利便性のために、標準的なフレームごとのデコーダをこちらで提供しています。

属性	详情
開発者	Stability AI
資金提供元	Stability AI
モデルの種類	生成的画像からビデオへのモデル
微調整元のモデル	SVD Image-to-Video [14 frames]

モデルのソース

研究目的では、最も人気のある拡散フレームワーク（訓練と推論の両方）を実装した generative-models GitHub リポジトリ (https://github.com/Stability-AI/generative-models) をお勧めします。

リポジトリ: https://github.com/Stability-AI/generative-models
論文: https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets

評価

comparison 上のグラフは、GEN-2 および PikaLabs と比較した場合の、SVD-Image-to-Video に対するユーザーの好みを評価しています。SVD-Image-to-Video は、ビデオ品質の点で人間の投票者に好まれています。ユーザー調査の詳細については、研究論文を参照してください。

使用方法

直接使用

このモデルは研究目的のみを意図しています。可能な研究分野とタスクには以下のようなものがあります。

生成モデルに関する研究。
有害なコンテンツを生成する可能性のあるモデルの安全なデプロイ。
生成モデルの制限とバイアスの調査と理解。
アートワークの生成とデザインやその他の芸術的プロセスでの使用。
教育または創造的なツールでのアプリケーション。

以下に除外される使用方法を説明します。

想定外の使用

このモデルは、人やイベントの事実的または真実の表現を生成するように訓練されていないため、そのようなコンテンツを生成するためにモデルを使用することは、このモデルの能力範囲外です。モデルは、Stability AI の Acceptable Use Policy に違反するような方法で使用してはいけません。