M

Myttvlns

kylielee505によって開発
多段階テキストから動画生成拡散モデルに基づき、英語の記述テキストを入力し、対応する動画クリップを返す
ダウンロード数 133
リリース時間 : 12/24/2024

モデル概要

このモデルはテキストから動画を生成するシステムで、拡散モデル技術を採用し、英語のテキスト記述に基づいて対応する動画コンテンツを生成できます。モデルはテキスト特徴抽出、テキスト特徴から動画潜在空間への拡散、動画潜在空間から視覚空間への変換という3つのサブネットワークで構成されています。

モデル特徴

多段階生成アーキテクチャ
テキスト特徴抽出、拡散モデル、視覚空間変換の3つのサブネットワークで構成され、高品質なテキストから動画生成を実現
長尺動画生成能力
最適化技術により16GB GPUメモリで最大25秒の動画を生成可能
アテンションメカニズムサポート
アテンションメカニズムとVAEスライスの有効化をサポートし、メモリ使用を最適化

モデル能力

テキストから動画生成
オープンドメインコンテンツ創作
動的シーン合成

使用事例

クリエイティブコンテンツ生成
コンセプト動画創作
テキスト記述に基づき迅速にクリエイティブなコンセプト動画を生成
'宇宙飛行士が馬に乗る'、'ダース・ベイダーがサーフィンする'などのクリエイティブ動画を生成可能
教育デモンストレーション
教材生成
教育コンテンツ用の動画素材を作成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase