T

Tora T2V Diffusers

由Alibaba-Research-Intelligence-Computing開發
Tora是一個基於擴散Transformer的視頻生成框架,能夠整合文本、視覺和軌跡條件生成高質量視頻內容。
下載量 17
發布時間 : 12/9/2024

模型概述

Tora是首個面向軌跡的DiT框架,通過軌跡提取器、時空DiT和運動引導融合器實現可控視頻生成,支持精確控制視頻動態特性。

模型特點

軌跡控制
通過軌跡提取器和運動引導融合器實現精確的視頻運動控制
多條件整合
可同時整合文本、視覺和軌跡條件進行視頻生成
高擴展性
設計與DiT的可擴展性完美契合,支持多種視頻參數控制
物理模擬
能夠精細模擬物理世界的運動規律

模型能力

文本生成視頻
軌跡控制視頻生成
多條件視頻合成
高保真運動生成

使用案例

創意內容生成
廣告視頻製作
根據文本描述和指定運動軌跡生成產品展示視頻
生成符合品牌要求的動態展示內容
動畫製作
通過軌跡控制生成角色動畫
實現精確的角色運動控制
教育演示
物理現象模擬
生成符合物理規律的運動演示視頻
幫助學生理解複雜物理概念
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase