Stable Video Diffusion Img2vid Xt
静止画像を条件フレームとして短い動画クリップを生成する拡散モデル
Downloads 170
Release Time : 12/14/2023
Model Overview
安定ビデオ拡散(SVD)画像変換動画は潜在拡散モデルで、条件画像から25フレーム576x1024解像度の短い動画を生成するように訓練されており、14フレーム版を微調整したものです
Model Features
高解像度動画生成
576x1024解像度の動画生成をサポート
長尺動画生成
25フレーム動画(約4秒)を生成可能で、基本14フレーム版より長い
時間的一貫性デコーダー
時間的一貫性を微調整したf8デコーダーを採用し、動画の連続性を向上
画像条件ベース生成
静止画像を入力条件として動的動画コンテンツを生成
Model Capabilities
静止画像から動画へ変換
短時間動画生成
クリエイティブコンテンツ生成
Use Cases
クリエイティブアート
アート創作
静止アート作品を動的動画表現に変換
芸術的な短い動画クリップを生成
デザイン支援
デザイン作品に動的効果を追加して展示
デザイン作品の動的効果を迅速にプレビュー
研究分野
生成モデル研究
動画生成アルゴリズムの研究と改良に使用
モデル安全性研究
生成モデルの安全な展開方法を研究
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98