DFoTオープンソースビデオ拡散モデル - 複数のコンテキストフレームに基づいて高品質のビデオを無料で生成

ホーム

Dfot

kiwhansongによって開発

任意の数のコンテキストフレームから高品質なビデオを生成できる新しいビデオ拡散モデル

動画処理オープンソースライセンス:MIT #ビデオ拡散生成 #マルチフレーム条件生成 #長尺ビデオ安定性

ダウンロード数 47.19k

リリース時間 : 2/7/2025

モデル概要

DFoTは革新的なビデオ生成モデルで、履歴誘導(HG)手法を組み合わせることで、ビデオ生成の品質、時間的一貫性、モーション・ダイナミクスを大幅に向上させ、単一フレームまたは複数フレームの画像から短いビデオや極めて長いビデオを生成可能

モデル特徴

履歴誘導(HG)手法

DFoT特有の誘導技術で、ビデオ生成品質、時間的一貫性、モーション・ダイナミクスを大幅に向上

柔軟なコンテキスト入力

任意の数(単一画像を含む)のコンテキストフレームからビデオ生成をサポート

長尺ビデオ生成能力

10秒以上の長尺ビデオを生成可能で、無限ナビゲーションビィデオ生成もサポート

組み合わせビデオ生成

異なるビデオクリップを組み合わせて一貫性のある長尺ビデオを生成可能

モデル能力

単一画像からビデオ生成

複数フレーム画像からビデオ生成

長時間安定ビデオ生成

組み合わせビデオ生成

ビデオ動的制御

使用事例

ビデオクリエーション

ショートビデオ生成

1-2枚の画像から2秒のショートビデオを生成

高品質で時間的一貫性のあるショートビデオクリップ

長尺ビデオ生成

単一画像から10秒以上の長尺ビデオを生成

動的に安定した一貫性のある長尺ビデオ

無限ナビゲーションビデオ

単一画像から無限に拡張可能なナビゲーションビデオを生成

持続的に安定した境界制限のないビデオストリーム

コンテンツ編集

ビデオ組み合わせ

異なるビデオクリップを組み合わせて一貫性のある新しいビデオを生成

シームレスに接続された組み合わせビデオ

🚀 Diffusion Forcing Transformer

このプロジェクトは、論文 History-guided Video Diffusion の公式モデルハブです。Diffusion Forcing Tranformer (DFoT) という新しいビデオ拡散モデルを導入しています。このモデルは、任意の数のコンテキストフレームを条件としてビデオを生成するように設計されています。さらに、DFoTによって可能になった History Guidance (HG) というガイダンス手法のファミリーも提案しています。これらの手法は、ビデオ生成の品質、時間的な一貫性、および動きのダイナミクスを大幅に向上させるだけでなく、合成ビデオ生成や極めて長いビデオの安定したロールアウトなどの新しい機能も実現します。

Kiwhan Song*¹ · Boyuan Chen*¹ · Max Simchowitz² · Yilun Du³ · Russ Tedrake¹ · Vincent Sitzmann¹
*Equal contribution ¹MIT ²CMU ³Harvard

論文 | ウェブサイト | HuggingFaceデモ | GitHubコード

image/png

🚀 クイックスタート

🤗 DFoTでビデオ生成を試してみましょう！

HuggingFace Spacesに インタラクティブなデモ を提供しています。ここでは、DFoTとHistory Guidanceを使ってビデオを生成できます。RealEstate10Kデータセットでは、以下のような生成が可能です。

任意の枚数の画像 → 2秒間の短いビデオ
単一の画像 → 10秒間の長いビデオ
単一の画像 → 無限のナビゲーションビデオ（上のティーザーのような！）

是非試して、DFoTで楽しくビデオを生成してみてください！

🚀 使用方法

すべての事前学習済みモデルは、私たちのGitHubコードベースから自動的に読み込むことができます。詳細な手順については、リポジトリをご覧ください！

📄 ライセンス

このプロジェクトはMITライセンスの下で公開されています。

📌 引用

もし私たちの研究があなたの研究に役立った場合は、以下のように論文を引用していただけると幸いです。

@misc{song2025historyguidedvideodiffusion,
  title={History-Guided Video Diffusion}, 
  author={Kiwhan Song and Boyuan Chen and Max Simchowitz and Yilun Du and Russ Tedrake and Vincent Sitzmann},
  year={2025},
  eprint={2502.06764},
  archivePrefix={arXiv},
  primaryClass={cs.LG},
  url={https://arxiv.org/abs/2502.06764}, 
}