N

Nova D48w1024 Osp480

由BAAI開發
北京智源研究院開發的非量化自迴歸文本生成視頻模型,能夠根據文本提示生成和編輯視頻
下載量 314
發布時間 : 12/17/2024

模型概述

基於非量化視頻自迴歸擴散架構(NOVA)開發的模型,採用預訓練文本編碼器(Phi-2)和視頻VAE標記器(OpenSoraPlanV1.2-VAE)構建,能夠根據文本提示生成和編輯視頻

模型特點

高分辨率視頻生成
能夠生成768x480像素分辨率的視頻
文本條件生成
根據文本提示生成和編輯視頻內容
參數可調
可通過調整參數提升生成視頻的畫質

模型能力

文本到視頻生成
視頻編輯
單幀圖像生成

使用案例

研究與教育
生成模型研究
用於生成模型相關技術研究
教育工具開發
開發教育或創意工具
創意與設計
藝術創作
用於藝術創作與設計應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase