W

Wan2.1 T2V 1.3B

由Isi99999開發
萬2.1是一套全面開放的視頻基礎模型,旨在突破視頻生成的邊界,支持中英雙語文本生成視頻、圖像生成視頻等多種任務。
下載量 40
發布時間 : 2/27/2025

模型概述

萬2.1是一個先進的視頻生成模型,支持文本生成視頻、圖像生成視頻、視頻編輯、文本生成圖像及視頻生成音頻等多種任務,具有頂尖性能和高效的計算效率。

模型特點

頂尖性能
在多項基準測試中均超越現有開源模型及商業解決方案。
支持消費級GPU
T2V-1.3B模型僅需8.19GB顯存,兼容幾乎所有消費級顯卡。
多任務支持
涵蓋文本生成視頻、圖像生成視頻、視頻編輯、文本生成圖像及視頻生成音頻。
視覺文本生成
首個支持中英雙語文本生成的視頻模型,文本生成能力強大。
高效視頻VAE
萬-VAE在編碼解碼任意長度1080P視頻時保持時序信息,為視頻與圖像生成提供理想基礎。

模型能力

文本生成視頻
圖像生成視頻
視頻編輯
文本生成圖像
視頻生成音頻

使用案例

創意視頻製作
擬人化動物視頻
生成擬人化動物行為的視頻,如貓咪拳擊比賽。
生成5秒480P視頻約需4分鐘(RTX 4090)。
教育內容
教學視頻生成
根據文本描述生成教學視頻內容。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase