T

Text To Video Ms 1.7b

vdoによって開発
多段階テキスト生成動画拡散モデルアーキテクチャに基づき、英語の記述テキストを入力すると記述に合った動画コンテンツを生成
ダウンロード数 55
リリース時間 : 5/7/2023

モデル概要

テキスト生成動画拡散モデルはテキスト特徴抽出、拡散モデル、動画生成の3つのサブネットワークを含み、総パラメータ数は約17億で、テキスト記述から動的な動画コンテンツを生成可能

モデル特徴

多段階生成アーキテクチャ
テキスト特徴抽出、拡散モデル、動画生成の3つのサブネットワークを含み、高品質な動画生成を実現
長尺動画生成能力
最適化技術により16GBのVRAMで最大25秒の動画を生成可能
オープンドメイン生成
任意の英語テキスト記述の動画生成をサポートし、応用シーンが幅広い

モデル能力

テキストから動画生成
オープンドメインコンテンツ創作
動的シーン合成

使用事例

クリエイティブコンテンツ生成
コンセプト可視化
抽象的なテキスト記述を可視化動画コンテンツに変換
テキスト記述に合致した動的シーンを生成
教育デモンストレーション
教育概念の可視化デモ動画を生成
複雑な概念の理解を支援
エンターテインメントコンテンツ創作
ショート動画生成
クリエイティブなテキストに基づきショート動画コンテンツを生成
宇宙飛行士が馬に乗る、ダース・ベイダーがサーフィンするなどのクリエイティブシーンを展示
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase