S

Stable Video Diffusion Img2vid

由lzyvegetable開發
基於靜態圖像生成短視頻片段的擴散模型,支持576x1024分辨率下生成14幀動態畫面
下載量 14
發布時間 : 9/2/2024

模型概述

一個潛在擴散模型,專為從條件圖像生成短視頻片段而訓練,包含時間一致性優化的解碼器

模型特點

時間一致性解碼
對f8解碼器進行時間一致性微調,確保視頻幀間連貫性
高分辨率支持
支持576x1024分辨率輸入輸出,生成質量優於同類模型
快速推理
在A100 80GB顯卡上單次生成耗時約100秒(SVD版本)

模型能力

靜態圖像動畫化
短視頻生成
時間一致性視頻合成

使用案例

創意內容生成
藝術創作
將靜態藝術作品轉化為動態展示
生成4秒內的藝術動畫
設計輔助
快速可視化設計概念的動態效果
產品原型動態演示
研究領域
生成模型研究
探索視頻生成模型的潛力和侷限性
安全研究
研究生成模型的安全部署方案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase