Trackdiffusion SVD Stage2
模型概述
TrackDiffusion是一種創新的視頻生成框架,通過將目標軌跡作為生成條件,實現了對視頻合成中複雜動態的精細化控制。該方法支持精確調控物體運動軌跡和交互行為,有效解決了物體出現/消失、尺度變化以及跨幀一致性等挑戰。
模型特點
軌跡條件輸入
以目標軌跡作為生成條件,實現對視頻合成的精細化控制
複雜動態處理
有效處理物體出現/消失、尺度變化等複雜動態場景
跨幀一致性
確保生成視頻中物體的跨幀一致性
模型能力
基於軌跡生成視頻
視頻動態控制
物體運動軌跡調控
使用案例
視頻生成
軌跡控制視頻合成
根據輸入的物體運動軌跡生成相應的視頻序列
生成與輸入軌跡匹配的視頻內容
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98