T

Text2motion

Quantamhashによって開発
オープンで先進的な大規模動画生成モデルキット、テキストから動画生成、画像から動画生成など多様なタスクをサポート
ダウンロード数 233
リリース時間 : 3/21/2025

モデル概要

テキストから動画へは包括的なオープンソースの動画基礎モデルキットで、動画生成の境界を突破し、中国語と英語のバイリンガルテキスト生成をサポート、480P/720Pのデュアル解像度に対応

モデル特徴

トップクラスの性能
複数のベンチマークテストで既存のオープンソースモデルや商用ソリューションを凌駕
コンシューマー向けGPUサポート
T2V-1.3Bモデルはわずか8.19GBのVRAMで動作、RTX 4090で5秒480P動画生成に約4分
マルチタスクサポート
テキストから動画生成、画像から動画生成、動画編集など多様なタスクをサポート
バイリンガルテキスト生成
中国語と英語のバイリンガルテキスト生成をサポートする初の動画モデル
高効率動画VAE
任意の長さの1080P動画をエンコード/デコードする際に時系列情報を保持、効率と性能を両立

モデル能力

テキストから動画生成
画像から動画生成
動画編集
テキストから画像生成
動画から音声生成

使用事例

エンターテインメントコンテンツ制作
アニメショート生成
テキスト記述に基づき擬人化動物アニメーションを生成
例:擬人化した2匹の猫のボクシング試合の480P/720P動画を生成
広告制作
製品紹介動画
製品説明に基づき自動的に紹介動画を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase