W

Wan2.1 Fun V1.1 14B Control

由alibaba-pai開發
阿里雲PAI團隊開發的1.3B參數文本生成視頻模型,支持多分辨率訓練及首尾幀預測
下載量 55
發布時間 : 4/24/2025

模型概述

該模型是基於擴散模型(diffusers)的文本到視頻生成系統,能夠根據文本描述生成高質量視頻內容。支持多種分辨率輸出,並具備首尾幀預測功能以提高視頻連貫性。

模型特點

多分辨率支持
支持512/768/1024等多種分辨率的視頻生成
首尾幀預測
增強視頻連貫性的特殊技術
多語言兼容
支持中英文文本輸入
控制條件支持
可結合Canny、Depth、Pose等控制條件生成視頻

模型能力

文本到視頻生成
多分辨率視頻生成
條件控制視頻生成
首尾幀預測

使用案例

創意內容生成
短視頻創作
根據文字描述自動生成創意短視頻
81幀,16FPS的流暢視頻
廣告製作
快速生成產品展示視頻
支持多種分辨率的專業級視頻
教育娛樂
教育視頻生成
將教材內容轉化為生動視頻
支持中英文教學內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase