W

Wan2.1 T2V 1.3B Diffusers

由Wan-AI開發
萬2.1是一套全面開放的視頻基礎模型,具備頂尖性能、支持消費級GPU、多任務支持、視覺文本生成和高效視頻VAE等特點。
下載量 45.29k
發布時間 : 3/1/2025

模型概述

萬2.1是一套開放且先進的大規模視頻生成模型,旨在突破視頻生成的邊界。它支持文本生成視頻、圖像生成視頻、視頻編輯、文本生成圖像及視頻生成音頻等多種任務。

模型特點

頂尖性能
在多項基準測試中持續超越現有開源模型及商業解決方案。
支持消費級GPU
T2V-1.3B模型僅需8.19GB顯存,兼容幾乎所有消費級顯卡。
多任務支持
擅長文本生成視頻、圖像生成視頻、視頻編輯、文本生成圖像及視頻生成音頻,推動視頻生成領域發展。
視覺文本生成
首個支持中英雙語文本生成的視頻模型,強大的文本生成能力顯著提升實用價值。
高效視頻VAE
萬-VAE在編碼解碼任意長度1080P視頻時保持時序信息,為視頻與圖像生成提供理想基礎。

模型能力

文本生成視頻
圖像生成視頻
視頻編輯
文本生成圖像
視頻生成音頻

使用案例

創意視頻製作
動畫短片生成
使用文本描述生成擬人化角色的動畫短片。
生成5秒480P視頻約需4分鐘(RTX 4090)
視頻編輯
視頻風格轉換
將現有視頻轉換為不同風格。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase