W

Wan2.1 T2V 1.3B Diffusers

Wan-AIによって開発
万2.1は包括的に開放されたビデオ基盤モデルで、トップクラスの性能、コンシューマー向けGPUサポート、マルチタスク対応、視覚テキスト生成、高効率ビデオVAEなどの特徴を備えています。
ダウンロード数 45.29k
リリース時間 : 3/1/2025

モデル概要

万2.1は開放型で先進的な大規模ビデオ生成モデルで、ビデオ生成の限界を突破することを目指しています。テキストからビデオ生成、画像からビデオ生成、ビデオ編集、テキストから画像生成、ビデオから音声生成など、多様なタスクをサポートします。

モデル特徴

トップクラスの性能
複数のベンチマークテストで既存のオープンソースモデルや商用ソリューションを継続的に上回っています。
コンシューマー向けGPUサポート
T2V-1.3Bモデルはわずか8.19GBのVRAMで動作し、ほぼすべてのコンシューマー向けグラフィックカードと互換性があります。
マルチタスク対応
テキストからビデオ生成、画像からビデオ生成、ビデオ編集、テキストから画像生成、ビデオから音声生成に優れており、ビデオ生成分野の発展を推進します。
視覚テキスト生成
初めて中英二言語のテキスト生成をサポートするビデオモデルで、強力なテキスト生成能力により実用価値を大幅に向上させます。
高効率ビデオVAE
万-VAEは任意の長さの1080Pビデオをエンコード/デコードする際に時系列情報を保持し、ビデオと画像生成に理想的な基盤を提供します。

モデル能力

テキストからビデオ生成
画像からビデオ生成
ビデオ編集
テキストから画像生成
ビデオから音声生成

使用事例

クリエイティブビデオ制作
アニメーションショート生成
テキスト記述を使用して擬人化キャラクターのアニメーションショートを生成します。
5秒480Pビデオ生成には約4分かかります(RTX 4090)
ビデオ編集
ビデオスタイル変換
既存のビデオを異なるスタイルに変換します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase