T

Tora T2V Diffusers

由 Alibaba-Research-Intelligence-Computing 开发
Tora是一个基于扩散Transformer的视频生成框架,能够整合文本、视觉和轨迹条件生成高质量视频内容。
下载量 17
发布时间 : 12/9/2024

模型简介

Tora是首个面向轨迹的DiT框架,通过轨迹提取器、时空DiT和运动引导融合器实现可控视频生成,支持精确控制视频动态特性。

模型特点

轨迹控制
通过轨迹提取器和运动引导融合器实现精确的视频运动控制
多条件整合
可同时整合文本、视觉和轨迹条件进行视频生成
高扩展性
设计与DiT的可扩展性完美契合,支持多种视频参数控制
物理模拟
能够精细模拟物理世界的运动规律

模型能力

文本生成视频
轨迹控制视频生成
多条件视频合成
高保真运动生成

使用案例

创意内容生成
广告视频制作
根据文本描述和指定运动轨迹生成产品展示视频
生成符合品牌要求的动态展示内容
动画制作
通过轨迹控制生成角色动画
实现精确的角色运动控制
教育演示
物理现象模拟
生成符合物理规律的运动演示视频
帮助学生理解复杂物理概念
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase