T

Text To Video Ms 1.7b

由vdo開發
基於多階段文本生成視頻擴散模型架構,輸入英文描述文本可生成符合描述的視頻內容
下載量 55
發布時間 : 5/7/2023

模型概述

文本生成視頻擴散模型包含文本特徵提取、擴散模型和視頻生成三個子網絡,總參數量約17億,支持從文本描述生成動態視頻內容

模型特點

多階段生成架構
包含文本特徵提取、擴散模型和視頻生成三個子網絡,實現高質量視頻生成
長視頻生成能力
通過優化技術可在16GB顯存下生成最長25秒的視頻
開放域生成
支持任意英文文本描述的視頻生成,應用場景廣泛

模型能力

文本到視頻生成
開放域內容創作
動態場景合成

使用案例

創意內容生成
概念可視化
將抽象文本描述轉化為可視化視頻內容
生成符合文本描述的動態場景
教育演示
生成教學概念的可視化演示視頻
幫助理解複雜概念
娛樂內容創作
短視頻生成
根據創意文本生成短視頻內容
示例中展示了宇航員騎馬、達斯·維達衝浪等創意場景
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase