T

Text2motion

由Quantamhash開發
開放且先進的大規模視頻生成模型套件,支持文本生成視頻、圖像生成視頻等多種任務
下載量 233
發布時間 : 3/21/2025

模型概述

文本轉動態是一套全面開放的視頻基礎模型套件,突破視頻生成邊界,支持中英雙語文本生成,兼容480P/720P雙分辨率

模型特點

頂尖性能
在多項基準測試中超越現有開源模型和商業解決方案
消費級顯卡支持
T2V-1.3B模型僅需8.19GB顯存,RTX 4090上生成5秒480P視頻約4分鐘
多任務支持
支持文本生成視頻、圖像生成視頻、視頻編輯等多種任務
雙語文本生成
首個支持中英雙語文本生成的視頻模型
高效視頻VAE
編解碼任意長度1080P視頻時保持時序信息,效率與性能俱佳

模型能力

文本生成視頻
圖像生成視頻
視頻編輯
文本生成圖像
視頻生成音頻

使用案例

娛樂內容創作
動畫短片生成
根據文本描述生成擬人化動物動畫
示例:生成兩隻擬人化貓咪拳擊比賽的480P/720P視頻
廣告製作
產品展示視頻
根據產品描述自動生成展示視頻
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase