W

Wan2.1 T2V 1.3B

Isi99999によって開発
万2.1はビデオ生成の境界を突破することを目的とした包括的なオープンビデオ基盤モデルで、中英二言語テキストから動画生成、画像から動画生成など多様なタスクをサポートします。
ダウンロード数 40
リリース時間 : 2/27/2025

モデル概要

万2.1は先進的なビデオ生成モデルで、テキストから動画生成、画像から動画生成、動画編集、テキストから画像生成、動画から音声生成など多様なタスクをサポートし、トップクラスの性能と高効率な計算効率を備えています。

モデル特徴

トップクラス性能
複数のベンチマークテストで既存のオープンソースモデル及び商用ソリューションを凌駕。
コンシューマーGPU対応
T2V-1.3Bモデルはわずか8.19GBのVRAMで動作し、ほぼ全てのコンシューマー向けグラフィックカードと互換性あり。
マルチタスクサポート
テキストから動画生成、画像から動画生成、動画編集、テキストから画像生成、動画から音声生成をカバー。
視覚的テキスト生成
初めて中英二言語テキスト生成をサポートするビデオモデルで、強力なテキスト生成能力を有する。
高効率動画VAE
万-VAEは任意の長さの1080P動画をエンコード/デコードする際に時系列情報を保持し、動画と画像生成の理想的な基盤を提供。

モデル能力

テキストから動画生成
画像から動画生成
動画編集
テキストから画像生成
動画から音声生成

使用事例

クリエイティブ動画制作
擬人化動物動画
擬人化された動物の行動動画を生成(例:猫のボクシング試合)。
5秒480P動画生成に約4分要する(RTX 4090使用時)。
教育コンテンツ
教育動画生成
テキスト記述に基づき教育動画コンテンツを生成。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase