W

Wan2.1 VACE 14B

由Wan-AI開發
Wan2.1是一套全面且開放的視頻基礎模型,旨在突破視頻生成的邊界,支持多種視頻生成和編輯任務。
下載量 8,797
發布時間 : 5/13/2025

模型概述

Wan2.1是一套先進的視頻生成模型,具備文本到視頻、圖像到視頻、視頻編輯、文本到圖像及視頻到音頻等多任務支持,推動視頻生成領域發展。

模型特點

SOTA性能
在多項基準測試中持續超越現有開源模型及最先進的商業解決方案。
支持消費級GPU
T2V-1.3B模型僅需8.19GB顯存,兼容幾乎所有消費級GPU。
多任務支持
在文本到視頻、圖像到視頻、視頻編輯、文本到圖像及視頻到音頻任務中表現卓越。
視覺文本生成
首個能生成中英雙語文本的視頻模型,具備強大的文本生成能力。
高效視頻VAE
Wan-VAE在編碼和解碼任意長度的1080P視頻時保持時序信息。

模型能力

文本到視頻生成
圖像到視頻生成
視頻編輯
文本到圖像生成
視頻到音頻生成
中英雙語文本生成

使用案例

視頻創作
短視頻生成
根據文本描述生成短視頻內容。
生成5秒480P視頻約需4分鐘(RTX 4090)。
視頻編輯
視頻風格轉換
根據參考圖像或文本修改視頻風格。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase